Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

Ironwood: la nueva TPU de Google para liderar la era de la inferencia en la nube

Google presenta su séptima generación de TPUs, diseñadas desde cero para impulsar modelos de IA inferencial a gran escala, con eficiencia energética, rendimiento extremo y escalabilidad sin precedentes.

Durante el evento Google Cloud Next 2025, la compañía ha desvelado Ironwood, su TPU (Tensor Processing Unit) de séptima generación, una arquitectura pensada exclusivamente para acelerar la inferencia de modelos de IA en entornos cloud. Se trata del mayor salto tecnológico en la trayectoria de estas unidades de procesamiento desde que Google lanzara su primera TPU en 2016.

Con Ironwood, Google redefine su infraestructura de inteligencia artificial para dar respuesta a un nuevo paradigma: el paso de modelos que reaccionan a modelos que piensan y actúan proactivamente. Esta transición marca el inicio de lo que desde la compañía denominan la “edad de la inferencia”.

Un salto histórico en potencia computacional

Ironwood puede escalar hasta 9.216 chips por pod, lo que equivale a 42,5 exaflops de potencia bruta, más de 24 veces la capacidad del superordenador más potente del mundo, El Capitan (1,7 exaflops). Cada chip individual alcanza un pico de rendimiento de 4.614 teraflops (FP8) y cuenta con 192 GB de memoria HBM, ofreciendo 7,2 TB/s de ancho de banda, cifras que rompen todos los límites anteriores en computación en la nube.

Esta capacidad masiva está diseñada para abordar modelos como Gemini 2.5 o AlphaFold, así como futuras arquitecturas de LLMs (Large Language Models) y MoEs (Mixture of Experts), que requieren procesamiento paralelo extremo, acceso a memoria ultrarrápido y una red interna que minimice la latencia. Para ello, Google ha implementado una red Inter-Chip Interconnect (ICI) con 1,2 Tbps bidireccionales, un 50% más que la generación anterior, Trillium.

Pensada para la inferencia, no solo el entrenamiento

Mientras que muchas arquitecturas de IA actuales están optimizadas para el entrenamiento, Ironwood ha sido desarrollada desde su base para maximizar la inferencia a escala. Esto se traduce en latencias más bajas, mayor eficiencia energética y una capacidad superior para servir modelos a miles de usuarios simultáneamente en entornos cloud.

“La era de la inferencia es aquella donde los modelos no solo reaccionan, sino que comprenden, interpretan y actúan”, afirma Sundar Pichai, CEO de Google. “Ironwood es nuestra apuesta para liderar esta transición”.

Una arquitectura al servicio del rendimiento y la eficiencia

Ironwood destaca no solo por su potencia, sino por su eficiencia térmica y energética. Gracias a su sistema de refrigeración líquida y a una ingeniería de chip profundamente optimizada, Ironwood consigue un rendimiento 2 veces superior por vatio en comparación con Trillium, y hasta 30 veces más eficiente que la TPU v2 de 2018.

En un momento donde la disponibilidad energética se ha convertido en un cuello de botella para escalar infraestructuras de IA, esta mejora en eficiencia se convierte en un diferenciador clave para clientes cloud que necesitan rendimiento, sí, pero también sostenibilidad y control de costes.

Dos configuraciones para adaptarse a cada carga de trabajo

Ironwood estará disponible en dos configuraciones principales en Google Cloud:

  • Ironwood 256: pensada para startups y empresas que necesitan rendimiento avanzado sin desplegar una infraestructura de hiperescala.
  • Ironwood 9.216: pensada para líderes del sector, como laboratorios de investigación, proveedores de LLMs o empresas que necesitan entrenar y servir modelos con billones de parámetros en tiempo real.

Ambas estarán integradas dentro del ecosistema AI Hypercomputer de Google Cloud, una arquitectura compuesta por hardware, red, almacenamiento y software optimizado, que permite a los desarrolladores escalar fácilmente mediante Pathways, el runtime de aprendizaje automático de Google DeepMind.

TPUv7 Inline TPUComparison

Soporte para workloads no tradicionales

Ironwood no solo está diseñada para LLMs o modelos generativos. También incorpora mejoras en SparseCore, el acelerador de inferencia especializado en grandes embeddings, utilizados habitualmente en sistemas de recomendación y búsqueda, pero cada vez más comunes en finanzas, salud o simulaciones científicas.

Esta evolución posiciona a Ironwood como una solución flexible, capaz de abarcar desde la IA conversacional hasta cargas de trabajo en sectores críticos donde la baja latencia, la consistencia y la escalabilidad son vitales.

Camino al futuro: AI-as-a-Service con ADN de Google

Google Cloud ha consolidado con Ironwood su posición como el proveedor más experimentado en computación para IA. No solo ha diseñado el hardware, sino también toda la pila de software, las redes de interconexión y el sistema operativo de inferencia distribuida.

“Google es el único hyperscaler con más de una década de experiencia en ofrecer IA a escala planetaria. Gmail, Google Search y otros servicios sirven a miles de millones de personas cada día con nuestra infraestructura”, explican desde el equipo de Google Cloud.

Con Ironwood, esta experiencia se traduce en una oferta de AI-as-a-Service que permitirá a cualquier empresa desplegar modelos potentes sin construir su propia infraestructura. Google se encarga de todo: desde la refrigeración hasta el escalado, pasando por la seguridad y el coste optimizado.

Conclusión: Ironwood es el futuro de la IA inferencial

Ironwood no es solo otro chip. Es la cristalización de una década de liderazgo en computación de IA y un puente hacia la próxima etapa de la inteligencia artificial, donde los modelos piensan, razonan y actúan.

Con mejoras significativas en potencia, memoria, redes y eficiencia, Ironwood marca un antes y un después en la infraestructura cloud para inteligencia artificial. Un futuro donde entrenar y servir modelos no será una barrera, sino una ventaja competitiva para quienes confíen en la nube como plataforma de innovación.

Fuente: Google blog

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO