Samsung Electro-Mechanics entra en la IA de centro de datos con Qualcomm

Nota de Prensa

Samsung Electro-Mechanics ha empezado a fabricar en masa sustratos FC-BGA para el Qualcomm AI200, el primer acelerador de inteligencia artificial de Qualcomm orientado a centros de datos. El movimiento, adelantado por ZDNet Korea y recogido por SamMobile, amplía una relación que hasta ahora estaba mucho más asociada a procesadores para móviles y PC, y la lleva a un terreno de mayor crecimiento: la infraestructura de IA para inferencia.

La noticia puede parecer menor frente a los grandes anuncios de GPU, memoria HBM o nuevos racks de 160 kW. No lo es. Los sustratos avanzados de encapsulado se han convertido en una pieza crítica de la cadena de suministro de semiconductores. Sin ellos, el chip no puede conectarse de forma eficiente a la placa, disipar calor correctamente ni sostener las velocidades eléctricas que exige un acelerador moderno. En la IA de centro de datos, la batalla también se libra bajo el silicio.

Qué aporta el FC-BGA al Qualcomm AI200

FC-BGA significa Flip-Chip Ball Grid Array. Es un tipo de sustrato de encapsulado que conecta el chip con la placa mediante pequeñas uniones, o bumps, en lugar de recurrir al cableado tradicional. La ventaja está en sus mejores propiedades eléctricas y térmicas, dos factores esenciales cuando se trabaja con semiconductores de alto rendimiento.

Según la información publicada, Samsung Electro-Mechanics ha comenzado la producción en su planta de Busan, en Corea del Sur. El sustrato FC-BGA destinado al Qualcomm AI200 tendría entre 10 y 15 capas internas, una complejidad inferior a la de los sustratos de más de 20 capas que se emplean en algunos aceleradores de entrenamiento de máxima gama. Esa diferencia encaja con el enfoque del AI200: no está diseñado para competir directamente en entrenamiento pesado contra los sistemas más grandes de NVIDIA o AMD, sino para inferencia de IA a escala de rack.

Qualcomm presentó oficialmente AI200 y AI250 en octubre de 2025 como soluciones optimizadas para inferencia en centros de datos. El AI200 está previsto para 2026 y el AI250 para 2027. La compañía afirma que el AI200 contará con 768 GB de memoria LPDDR por tarjeta, refrigeración líquida directa, PCIe para escalado interno, Ethernet para escalado entre sistemas, confidential computing y un consumo de 160 kW a nivel de rack. La apuesta no pasa por usar HBM en esta primera generación, sino por una arquitectura que busca capacidad de memoria, eficiencia energética y menor coste por inferencia.

Elemento	Qualcomm AI200	Lectura para centros de datos
Tipo de producto	Acelerador de IA para inferencia	Enfocado a ejecutar modelos ya entrenados
Disponibilidad prevista	2026	Primera generación de la nueva hoja de ruta de Qualcomm
Memoria	768 GB de LPDDR por tarjeta	Más capacidad y menor coste frente a alternativas basadas en HBM
Encapsulado	FC-BGA fabricado por Samsung Electro-Mechanics, según ZDNet Korea	Pieza crítica para conexión eléctrica y gestión térmica
Capas del sustrato	Entre 10 y 15, según la información publicada	Menos complejo que aceleradores de entrenamiento de gama extrema
Escalado	PCIe y Ethernet	Integración en sistemas y racks de inferencia
Refrigeración	Líquida directa a nivel de rack	Diseño pensado para densidad en centro de datos
Siguiente generación	Qualcomm AI250 en 2027	Añadirá arquitectura de memoria basada en near-memory computing

Qualcomm busca un hueco entre NVIDIA, AMD y los chips propios

La entrada de Qualcomm en aceleradores de IA para centros de datos no parte de cero. La compañía lleva años desarrollando NPUs, procesadores de bajo consumo y soluciones de IA en dispositivos, pero el salto a racks de inferencia la coloca en una liga distinta. El mercado que intenta atacar está dominado por NVIDIA en entrenamiento y por una competencia creciente en inferencia, donde también se mueven AMD, Intel, Broadcom, Marvell, los chips propios de los hiperescalares y nuevas compañías especializadas.

Qualcomm no pretende presentarse como otra copia del modelo HBM más GPU. Su discurso se apoya en rendimiento por dólar y por vatio, capacidad de memoria con LPDDR, compatibilidad con frameworks de IA y despliegue de modelos de lenguaje y modelos multimodales ya entrenados. Esa diferenciación tiene sentido porque la inferencia va a convertirse en una parte enorme del coste operativo de la IA. Entrenar un modelo es caro, pero servirlo cada día a millones de usuarios también lo es.

Ahí el encapsulado gana protagonismo. La disponibilidad de FC-BGA de calidad puede condicionar la capacidad de producir chips avanzados en volumen. Los grandes aceleradores exigen sustratos con más capas, materiales como ABF, tolerancias ajustadas y capacidad térmica suficiente. La cadena ya estaba tensionada por CPUs de servidor, GPUs, ASICs de IA y chips de red. Que Samsung Electro-Mechanics entre como proveedor del AI200 muestra cómo los fabricantes de componentes coreanos quieren capturar valor en la expansión de la IA más allá de la memoria.

Para Samsung Electro-Mechanics, el acuerdo es una vía para crecer en un segmento de mayor margen. La compañía ya había invertido en ampliar su negocio de FC-BGA, incluido un plan de 850 millones de dólares anunciado en 2021 para capacidades en Vietnam, y suministraba sustratos para procesadores de aplicación de Qualcomm en dispositivos móviles. Ahora la relación se desplaza hacia una categoría con ciclos de producto y requisitos más cercanos al servidor.

La inferencia abre otra cadena de suministro

El AI200 también ayuda a entender una diferencia importante dentro de la IA. No toda la infraestructura se diseña igual. Los aceleradores para entrenamiento extremo tienden a requerir HBM, interconexiones muy densas, encapsulados más complejos y sistemas pensados para mover cantidades enormes de datos durante semanas o meses. La inferencia, en cambio, necesita servir respuestas de forma eficiente, con latencia controlada, coste bajo y capacidad para escalar a muchos usuarios o agentes.

Por eso un chip de inferencia puede elegir una arquitectura distinta. El uso de LPDDR5 reduce complejidad frente a HBM y permite más capacidad de memoria por tarjeta, aunque con otro perfil de ancho de banda. En cargas de modelos de lenguaje, donde el coste por token y el consumo por rack importan cada vez más, esa decisión puede ser competitiva si el software acompaña y si el sistema mantiene buena utilización.

Qualcomm asegura que AI200 y AI250 formarán parte de una hoja de ruta anual en centros de datos. El AI250, previsto para 2027, incorporará una arquitectura de memoria basada en near-memory computing, con la que la compañía promete un salto en ancho de banda efectivo y eficiencia frente al AI200. Es pronto para saber qué adopción logrará esta familia, pero el hecho de que Samsung Electro-Mechanics ya haya iniciado producción de FC-BGA para el primer producto apunta a una fase más concreta que una simple presentación comercial.

La posible entrada de LG Innotek en la cadena de suministro del AI200 a partir del próximo año, según las mismas informaciones, añade otra señal. Los sustratos avanzados se están convirtiendo en un mercado estratégico para Corea del Sur, igual que la memoria HBM lo ha sido para SK hynix, Samsung Electronics y Micron. En IA, el valor ya no se concentra solo en quien diseña el acelerador. También se reparte entre foundries, encapsulado avanzado, memoria, sustratos, red, refrigeración y ensamblaje de racks.

La lectura para el mercado cloud es clara: la expansión de la IA generativa está redibujando toda la cadena de infraestructura. Qualcomm quiere entrar en centros de datos por la puerta de la inferencia eficiente. Samsung Electro-Mechanics quiere que sus sustratos formen parte de esa nueva demanda. Y los proveedores cloud buscan alternativas que reduzcan el coste de ejecutar modelos a gran escala sin depender únicamente de las plataformas más caras del mercado.

El éxito del AI200 no dependerá solo de su chip. Dependerá de software, disponibilidad, coste, integración en racks, consumo, memoria, red y capacidad de producción. El inicio de la fabricación de FC-BGA en Busan no resuelve todas esas incógnitas, pero sí deja una señal importante: Qualcomm ya está moviendo su cadena de suministro para que su apuesta por la IA de centro de datos llegue al mercado.

Preguntas frecuentes

¿Qué fabrica Samsung Electro-Mechanics para Qualcomm?
Según ZDNet Korea y SamMobile, Samsung Electro-Mechanics ha empezado a producir sustratos FC-BGA para el Qualcomm AI200, el primer acelerador de IA de Qualcomm orientado a centros de datos.

¿Qué es un sustrato FC-BGA?
Es una base avanzada de encapsulado que conecta el chip con la placa mediante bumps de flip-chip. Ofrece mejores propiedades eléctricas y térmicas que el wire bonding tradicional, por eso se usa en semiconductores de alto rendimiento.

¿El Qualcomm AI200 compite con las GPU de entrenamiento de NVIDIA?
No exactamente. AI200 está optimizado para inferencia de IA, es decir, para ejecutar modelos ya entrenados. Su diseño con LPDDR busca capacidad, eficiencia y menor coste operativo, no entrenamiento extremo basado en HBM.

¿Cuándo llegarán Qualcomm AI200 y AI250?
Qualcomm prevé disponibilidad comercial del AI200 en 2026 y del AI250 en 2027. El AI250 incorporará una arquitectura de memoria basada en near-memory computing.

vía: sammobile