Samsung y TSMC se reparten los chips de inferencia de Nvidia

La carrera por la inteligencia artificial ya no se decide solo en el entrenamiento de modelos grandes. La inferencia, esa fase en la que los modelos responden, razonan y ejecutan tareas para alimentar agentes de IA, se ha convertido en un nuevo frente para fabricantes de chips, fundiciones y proveedores de memoria. Sobre ese tablero, Samsung tiene una oportunidad poco habitual: recuperar peso dentro de la cadena de suministro de Nvidia.

El detonante es la tecnología LPU de Groq, diseñada para inferencia de baja latencia. Algunos análisis del sector hablan incluso de adquisición encubierta, aunque el comunicado oficial de Groq describe el movimiento como una licencia no exclusiva de su tecnología de inferencia para Nvidia, acompañada por la incorporación de Jonathan Ross, fundador de Groq, Sunny Madra y otros miembros del equipo a la compañía de Jensen Huang. Groq mantiene su actividad como empresa independiente con Simon Edwards al frente.

Samsung gana visibilidad con Groq 3 y la inferencia de IA

El interés de Samsung va más allá de fabricar un chip concreto. La compañía surcoreana quiere demostrar que puede volver a ser relevante para Nvidia en algo más que la memoria HBM. En GTC 2026 reforzó su mensaje como socio en memoria, fundición y empaquetado avanzado, y recordó que Jensen Huang la mencionó como aliado clave en la fabricación de la nueva LPU de Groq.

El movimiento tiene su importancia. Nvidia ha dependido durante años de TSMC para sus GPU más avanzadas. Que una pieza ligada a la futura plataforma de inferencia pase por Samsung Foundry no cambia el equilibrio del sector de un día para otro, pero sí abre una grieta en una relación históricamente dominada por la fundición taiwanesa.

Según informaciones del sector, Groq 3 se fabricará en Samsung Foundry con un proceso de 4 nm. A diferencia de muchas GPU de IA, este chip se orienta a cargas de inferencia y se apoya en una arquitectura basada en SRAM, no en grandes pilas de memoria HBM. Esa diferencia técnica explica parte del interés de Nvidia. Las GPU siguen siendo imprescindibles para entrenamiento y para muchas cargas generales, pero los modelos generativos y los agentes piden cada vez más aceleradores capaces de responder con baja latencia y alto rendimiento durante la ejecución, un patrón que también está empezando a tensar otras piezas de la infraestructura, como reflejamos al hablar de cómo la inferencia presiona ya a las CPU según Intel.

La paradoja es interesante. Samsung trata de reforzar su posición en Nvidia apoyándose tanto en su papel en HBM como en una LPU que, justamente, no depende de HBM como sí lo hace una GPU de entrenamiento. Su argumento industrial es más amplio: ofrecer memoria avanzada, fabricación lógica y empaquetado como una solución integrada para la infraestructura de IA.

La baza de Samsung: HBM, fundición y empaquetado

Samsung sabe que la memoria de alto ancho de banda se ha vuelto una pieza crítica para la IA. En su presencia en GTC 2026 mostró HBM4E y avanzó detalles de la futura HBM5. También enseñó tecnologías de empaquetado como Hybrid Copper Bonding, orientadas a mejorar la gestión térmica en entornos de alto rendimiento.

Esa combinación es clave. Los grandes sistemas de IA ya no dependen solo de tener el mejor chip, sino de integrar GPU, aceleradores especializados, memoria, interconexión, almacenamiento, red y refrigeración en plataformas cada vez más densas. En ese contexto, Samsung aspira a vender una propuesta más completa: no solo obleas, no solo memoria, sino una cadena tecnológica más cosida.

Para Nvidia tendría también sentido contar con un segundo socio de fabricación en determinadas líneas. TSMC sigue siendo el proveedor dominante para los chips más avanzados de la compañía, pero la demanda de IA ha tensado la capacidad de producción, el empaquetado avanzado y la disponibilidad de memoria. Diversificar proveedores ayuda a negociar mejor, reducir riesgos y acelerar la disponibilidad de productos concretos.

Samsung, eso sí, todavía debe demostrar consistencia. Ganar una orden vinculada a Groq 3 no equivale a desplazar a TSMC en las GPU de mayor volumen y valor. La confianza en procesos avanzados, el rendimiento por oblea, la eficiencia energética, el empaquetado y la capacidad de entrega siguen siendo decisivos. En ese terreno TSMC mantiene una posición muy fuerte.

TSMC no se queda quieta

El titular de la pugna es sencillo. Samsung quiere convertir la LPU de Groq en una puerta de entrada a más negocio con Nvidia, mientras TSMC intenta proteger su papel central en la cadena de suministro del gigante estadounidense. DigiTimes ha apuntado que TSMC estaría presionando para disputar futuras generaciones de LPU, lo que matiza la idea de que la ventaja inicial de Samsung esté garantizada a largo plazo.

El interés de TSMC es razonable. Si la inferencia y los agentes de IA crecen como esperan los grandes proveedores cloud, las LPU y otros aceleradores especializados podrían convertirse en una nueva categoría relevante dentro del centro de datos. No sustituirían a las GPU, pero sí complementarían su trabajo en tareas donde la latencia, el coste por token y la eficiencia energética sean críticos.

Para Nvidia, la integración de la tecnología de Groq tiene una doble lectura, defensiva y ofensiva. Defensiva, porque evita que un competidor especializado en inferencia gane demasiado terreno en un mercado que empieza a diversificarse. Ofensiva, porque le permite ampliar su plataforma más allá de la GPU tradicional y adaptar su oferta a un escenario donde los clientes no solo entrenan modelos, también ejecutan millones de consultas, agentes y flujos automatizados en tiempo real. Conviene situar este movimiento dentro del cuadro más amplio de tensión geopolítica y regulatoria que afecta al sector, donde Estados Unidos endurece su ofensiva contra DeepSeek y Europa regula la IA sin terminar de dominar su cadena de valor.

El resultado puede ser una arquitectura más heterogénea. En lugar de una infraestructura concentrada casi exclusivamente en GPU, los centros de datos de IA podrían combinar GPU, CPU, DPU, aceleradores de inferencia, memoria HBM, SRAM integrada y redes de muy baja latencia. La ventaja competitiva ya no estará solo en el chip más potente, sino en la plataforma que mejor combine todos esos elementos.

Una batalla industrial que va más allá de Nvidia

La disputa entre Samsung y TSMC por las LPU de Nvidia refleja una tendencia más amplia. La IA está reordenando la industria de semiconductores en torno a tres cuellos de botella: capacidad de fabricación avanzada, memoria de alto rendimiento y empaquetado. Quien controle esas piezas tendrá una posición privilegiada en la próxima década de infraestructura digital.

Samsung necesita recuperar credibilidad en fundición avanzada y aprovechar su fortaleza histórica en memoria. TSMC quiere evitar que sus clientes estratégicos diversifiquen demasiado pedidos hacia competidores. Nvidia, mientras tanto, juega con una posición de poder muy cómoda: puede repartir cargas entre proveedores, integrar tecnologías externas y usar su volumen como palanca de negociación.

Conviene, aun así, no sacar conclusiones precipitadas. La información disponible apunta a una colaboración relevante entre Nvidia, Groq y Samsung, pero no confirma que Samsung vaya a arrebatar a TSMC una parte estructural del negocio principal de Nvidia. Por ahora hablamos de una oportunidad abierta, no de un cambio de liderazgo confirmado.

Lo que sí parece claro es que la inferencia se ha convertido en el nuevo campo de batalla. Si durante los últimos años la conversación giró alrededor del entrenamiento de modelos cada vez más grandes, el negocio empieza a moverse hacia el despliegue masivo de IA en aplicaciones reales. Ahí importan la velocidad de respuesta, el coste operativo, la eficiencia energética y la capacidad de escalar millones de peticiones, justo el tipo de cargas que también empuja la empresa agéntica que Google Cloud llevó a producción en Next 26.

Samsung ha visto una oportunidad para regresar al centro de la conversación. TSMC no tiene intención de ceder terreno. Y Nvidia, como gran árbitro de esta nueva fase de la IA, puede acabar como principal beneficiada de una competencia que abarate, diversifique y acelere su propia hoja de ruta.

Preguntas frecuentes

¿Qué es una LPU y por qué interesa a Nvidia?

Una LPU, o Language Processing Unit, es un acelerador especializado en tareas de inferencia para modelos de lenguaje. Su valor está en ejecutar respuestas y cargas secuenciales con baja latencia, un punto cada vez más crítico para chatbots, asistentes y agentes de IA.

¿Nvidia ha comprado Groq?

Oficialmente no. Groq anunció un acuerdo de licencia no exclusiva de su tecnología de inferencia con Nvidia y comunicó que su fundador, Jonathan Ross, su presidente, Sunny Madra, y otros miembros del equipo se incorporarían a Nvidia. Groq mantiene su actividad como empresa independiente.

¿Por qué Samsung es importante en los chips de IA de Nvidia?

Samsung quiere reforzar su papel como proveedor de memoria HBM, fundición y empaquetado avanzado. Su participación en la fabricación de la LPU de Groq para Nvidia le da visibilidad como alternativa o complemento a TSMC en partes concretas de la cadena de suministro.

¿Puede Samsung sustituir a TSMC como principal fabricante de Nvidia?

No hay datos que apunten a un reemplazo general de TSMC. La oportunidad de Samsung se centra, por ahora, en chips concretos y en su capacidad de ofrecer memoria, fundición y empaquetado en bloque. TSMC sigue siendo un socio clave para los productos más avanzados de Nvidia.

¿Qué significa la apuesta por LPU para los centros de datos de IA?

Apunta a un futuro más heterogéneo, donde GPU, CPU, DPU y aceleradores de inferencia conviven con memoria HBM y SRAM en plataformas optimizadas por carga. La latencia, el coste por token y la eficiencia energética ganan peso frente al pico de potencia bruta.

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO

Las últimas novedades de tecnología y cloud

Suscríbete gratis al boletín de Revista Cloud. Cada semana la actualidad en tu buzón.

Suscripción boletín
×