La séptima generación de aceleradores de inteligencia artificial de Google ya tiene nombre y silicio: TPU v7 Ironwood. Diseñada para competir de tú a tú con las GPUs Blackwell de NVIDIA en cargas de inferencia a gran escala, esta nueva familia de chips no solo es un movimiento estratégico para Google Cloud. También se ha convertido en una oportunidad millonaria para MediaTek, que ha colaborado en el diseño y ahora busca trasladar parte de ese aprendizaje a su próximo SoC móvil de gama alta, el Dimensity 9600.
Ironwood: la TPU con la que Google quiere desafiar a NVIDIA
Ironwood es la séptima generación de TPU de Google y está pensada para entrenamiento e inferencia de modelos gigantes, tanto densos como Mixture-of-Experts. Cada chip TPU7x integra:
- Dos TensorCores para cómputo matricial (incluyendo FP8) y
- Cuatro SparseCores, optimizados para trabajar con estructuras dispersas como embeddings, muy habituales en modelos de lenguaje.
- 192 GiB de memoria HBM3E por chip, con un ancho de banda cercano a 7,4 TB/s.
La arquitectura adopta un diseño dual-chiplet: cada chip físico se divide en dos “dispositivos” lógicos, cada uno con su propio TensorCore, SparseCores y 96 GiB de HBM. Las dos mitades se comunican a través de un enlace die-to-die hasta 6 veces más rápido que las interconexiones tradicionales entre chips (ICI).
A nivel de sistema, Google escala estos chips hasta configuraciones extremas:
- 64 chips forman un “cubo” básico de TPU, interconectados con 1,2 TB/s de ancho de banda bidireccional por chip.
- Varios cubos se conectan mediante una red de Optical Circuit Switching (OCS) para crear un superpod de 9.216 chips, con unos 42,5 exaFLOPS FP8 y 1,77 PB de HBM compartida.
Con estas cifras, Ironwood cierra gran parte de la brecha en cómputo, memoria y ancho de banda frente a la plataforma GB200/GB300 de NVIDIA, y lo hace con un enfoque muy agresivo en eficiencia energética y coste total de propiedad (TCO) para inferencia, el segmento que más crece en la nube.
El papel de MediaTek: del I/O de Ironwood al diseño de SoCs móviles
La parte más interesante de esta historia para la industria móvil está en quién ha ayudado a Google a levantar este monstruo. A diferencia de generaciones anteriores, donde Broadcom había sido el socio clave de diseño, varios informes apuntan a que Google se apoyó en MediaTek para diseñar los módulos de entrada/salida (I/O) de Ironwood, responsables de la comunicación del chip con el resto del sistema.
Ese movimiento tiene varias lecturas:
- Cambio de socio estratégico: Google diversifica su dependencia respecto a Broadcom y apuesta por un proveedor con mucha experiencia en SoCs de consumo, donde la relación rendimiento/consumo es crítica.
- Know-how reutilizable: aunque una TPU de centro de datos y un SoC móvil son arquitecturas muy distintas, el diseño de I/O de alta velocidad, la gestión de energía y el empaquetado avanzado comparten problemas de fondo.
- Impacto económico directo: estimaciones de UBS apuntan a que MediaTek podría ingresar alrededor de 4.000 millones de dólares gracias a su colaboración con Google en esta séptima generación de TPUs.
Para MediaTek, no se trata solo de una línea de negocio adicional en IA para centros de datos, sino de un banco de pruebas de primer nivel para mejorar la eficiencia de sus futuros chipsets móviles, en un momento en el que la compañía ha apostado por diseños muy agresivos en rendimiento.
Dimensity 9600: un flagship que necesita cada miliwatio de eficiencia
El Dimensity 9600 será el próximo buque insignia de MediaTek para smartphones 5G de gama alta. Las filtraciones lo colocan en 2026 como un SoC fabricado en uno de los nodos más avanzados de TSMC, con un rendimiento que se situaría entre el Snapdragon 8 Elite Gen 6 “normal” y la versión Pro de Qualcomm.
En paralelo, la compañía viene de una estrategia arriesgada: con el Dimensity 9300 y 9500 ya prescindió de los tradicionales núcleos de eficiencia, apostando por configuraciones solo de núcleos grandes (big cores), lo que disparó el debate sobre su consumo real en escenarios prolongados de uso.
En este contexto, cualquier ganancia en la gestión de energía es oro. Y ahí es donde encaja el aprendizaje en Ironwood:
- Power gating más agresivo
Diseñar I/O para una TPU que mueve terabytes por segundo de HBM obliga a exprimir la desactivación selectiva de bloques cuando no se usan. MediaTek puede trasladar estas técnicas al Dimensity 9600 para apagar controladores, buses y periféricos de forma más granular, reduciendo el consumo en reposo y en uso ligero. - Mejor voltage scaling
Ironwood trabaja con márgenes de tensión muy optimizados para maximizar la eficiencia en FP8 y BF16. Ajustar los algoritmos de regulación de voltaje en el Dimensity 9600 —por ejemplo, mediante curvas DVFS más finas— puede ayudar a que el SoC opere el máximo tiempo posible en puntos de “dulce” eficiencia. - Refinamiento del clock-gating
La experiencia afinando rutas de reloj en una TPU de alta densidad se puede reutilizar para reducir el clock allí donde no aporta rendimiento visible. En un SoC móvil sin núcleos de eficiencia, la capacidad de “quitar ritmo” a bloques enteros cuando no aportan valor es clave para no destrozar la batería.
Wccftech y otras fuentes subrayan que MediaTek no puede trasladar de forma directa todo lo aprendido en Ironwood a un procesador móvil, por las diferencias obvias entre un ASIC de datacenter y un AP de smartphone. Aun así, la compañía tendría margen para una serie de mejoras iterativas que podrían marcar la diferencia en autonomía frente a Qualcomm y Apple.
IA en la nube e IA en el bolsillo: dos frentes, una misma batalla
La colaboración entre Google y MediaTek es también un síntoma de cómo se está configurando la cadena de valor de la IA:
- En la nube, Ironwood y los TPUs de Google compiten por reducir el coste por token inferido y aumentar el rendimiento por vatio, buscando erosionar el dominio de NVIDIA en hyperscalers.
- En el dispositivo, los Dimensity y Snapdragon de nueva generación compiten por ejecutar modelos generativos y asistentes locales con el mínimo impacto posible en batería y temperatura.
MediaTek juega ahora en ambos frentes. Su trabajo en los módulos de I/O de Ironwood la coloca en la primera línea de la IA de ultra escala en centros de datos, mientras que el Dimensity 9600 será el escaparate de cuánto de esa experiencia es capaz de destilar en un chip que cabe en el bolsillo.
Si el salto de eficiencia se materializa, el usuario final no verá “TPU v7” en las especificaciones de su móvil, pero sí podría notarlo en más autonomía, menos throttling y capacidades de IA local más sostenibles. Y, en un mercado donde todos presumen de TOPS y NPU, quizá la verdadera ventaja competitiva esté, una vez más, en algo tan viejo como la ingeniería de eficiencia.