Qualcomm lleva Dragonfly al centro de datos para competir en la IA agéntica

Nota de Prensa

Qualcomm quiere que su próxima gran etapa no dependa del smartphone. La compañía ha presentado una hoja de ruta completa para centros de datos bajo la marca Dragonfly, con una CPU propia, aceleradores de inferencia, una nueva tecnología de cómputo cercana a memoria, conectividad de alta velocidad y silicio personalizado para grandes clientes. El objetivo es entrar en la infraestructura de inteligencia artificial justo cuando la inferencia y los agentes empiezan a consumir una parte creciente del presupuesto de los hiperescalares.

La propuesta llega acompañada de señales comerciales relevantes. Qualcomm ha anunciado un acuerdo multigeneracional con Meta para suministrar CPUs de centro de datos y, según información de mercado, Microsoft figura entre los clientes que utilizarán su nueva tecnología High Bandwidth Compute. También hay acuerdos con dos hiperescalares no identificados para silicio personalizado. Es decir, Qualcomm no presenta solo una familia de chips: intenta demostrar que ya tiene clientes para justificar su regreso al data center.

La compañía parte de una idea sencilla. La IA agéntica disparará el número de tokens, consultas, herramientas, llamadas intermedias y tareas encadenadas. En ese escenario, el coste por token y el rendimiento por vatio pesan tanto como la potencia bruta. Si la inferencia se convierte en la carga dominante, la infraestructura deberá ser más eficiente, más modular y menos dependiente de arquitecturas pensadas principalmente para entrenamiento masivo.

Dragonfly C1000: una CPU Arm para servidores de IA

La pieza más visible de la hoja de ruta es Qualcomm Dragonfly C1000, una CPU de centro de datos diseñada para cargas scale-out, orquestación de agentes, usos generalistas e infraestructura de IA. El producto estará basado en núcleos Oryon personalizados, con frecuencias superiores a 5 GHz, más de 250 núcleos en diseño chiplet y conectividad PCIe Gen 7 por encima de 2 TB/s, además de soporte CXL.

Qualcomm afirma que la CPU está diseñada para ofrecer más de dos veces mejor rendimiento por vatio frente a referencias competitivas de servidor, según estimaciones basadas en especificaciones. Conviene leer esa cifra como una promesa de diseño, no como un resultado independiente en producción. La disponibilidad comercial se espera en 2028.

La importancia de C1000 no está en sustituir a las GPUs, sino en lo que las rodea. Los grandes clústeres de IA necesitan CPUs para coordinar aceleradores, mover datos, ejecutar servicios de control, gestionar memoria, atender cargas web, servir agentes y reducir cuellos de botella de infraestructura. Si una CPU consume menos y mantiene buen rendimiento por núcleo, puede mejorar el coste total del sistema.

Producto	Papel previsto	Calendario
Dragonfly C1000	CPU para servidores, agentes, head nodes e infraestructura de IA	2028
Dragonfly AI200	Acelerador de inferencia de primera generación	2026
Dragonfly AI250	Acelerador con HBC Gen 1	Muestreo comercial previsto a mediados de 2027
Dragonfly AI300	Acelerador de inferencia con HBC Gen 2	Muestreo comercial previsto en 2028
HBC	Cómputo cercano a memoria para reducir el “memory wall”	Ruta multigeneracional
Silicio personalizado	ASIC para clientes de gran escala	Primeros ingresos antes de final de 2026, según Reuters

La CPU también sirve para dar credibilidad a una plataforma completa. Qualcomm no quiere vender una tarjeta aislada, sino una arquitectura de rack con cómputo, memoria, conectividad, software y opciones a medida. Ese enfoque es el que ya domina en los grandes centros de datos de IA: el rendimiento final depende del sistema, no solo del chip.

HBC: el intento de romper el muro de memoria

La parte más técnica del anuncio es Qualcomm High Bandwidth Compute, o HBC. La compañía lo describe como una arquitectura near-memory computing que une cómputo y memoria de alto ancho de banda en una solución 3D-stacked. Su finalidad es atacar uno de los problemas centrales de la IA actual: mover datos cuesta energía, tiempo y dinero.

El “memory wall” no es nuevo, pero la IA lo ha llevado al límite. Los modelos grandes necesitan acceder de forma continua a enormes volúmenes de parámetros, contexto, memoria intermedia y datos. En inferencia, especialmente con agentes que razonan durante más tiempo o llaman a herramientas, el ancho de banda y la eficiencia de memoria pueden determinar el coste por token.

Qualcomm sostiene que HBC Gen 1, integrado en AI250, permitirá 133 TB/s por tarjeta y un aumento de 18 veces en ancho de banda efectivo frente a AI200 con LPDDR5X. Con HBC Gen 2, Dragonfly AI300 daría otro salto, con una mejora de 54 veces frente a AI200. La compañía también habla de 6 veces más ancho de banda por vatio frente a HBM y 200 veces más capacidad por vatio frente a SRAM, comparando especificaciones publicadas y normalizadas por tarjeta o rack.

Tecnología	Promesa técnica de Qualcomm
HBC Gen 1 en AI250	133 TB/s por tarjeta y 18x frente a AI200
HBC Gen 2 en AI300	54x frente a AI200
HBC frente a HBM	6x más ancho de banda por vatio, según especificaciones publicadas
HBC frente a SRAM	200x más capacidad por vatio a nivel rack
Objetivo	Menor energía por token y mejor coste de inferencia

Aquí está una de las apuestas más interesantes de Qualcomm. Mientras NVIDIA domina con HBM en GPUs de IA y otros actores exploran memoria SRAM o arquitecturas especializadas, Qualcomm intenta apoyarse en su experiencia histórica en bajo consumo, LPDDR, integración de sistema y empaquetado avanzado para ofrecer una vía alternativa. La pregunta es si esa ventaja será suficiente en cargas reales, con modelos reales y software maduro.

Dragonfly AI300 y una cadencia anual para inferencia

Dragonfly AI300 será la tercera generación de la hoja de ruta de aceleradores de inferencia, tras AI200 y AI250. Qualcomm quiere mantener una cadencia anual, algo habitual en las GPUs de IA, pero menos frecuente para un actor que está entrando de nuevo en centros de datos.

AI300 se plantea como una plataforma de rack para inferencia, con refrigeración por aire y líquida directa, HBC Gen 2, despliegues desagregados y soporte para grandes modelos de lenguaje y modelos multimodales. La compañía espera entre cuatro y ocho veces mejor rendimiento por vatio frente a arquitecturas GPU existentes, medido sobre ancho de banda de memoria por vatio y por tarjeta. También menciona escalado con UALink y ESUN, además de cobre y óptica para scale-out.

La decisión de centrar Dragonfly en inferencia no es casual. Entrenar modelos frontera seguirá siendo un terreno dominado por NVIDIA, los TPU de Google, Trainium de Amazon, chips propios de grandes laboratorios y soluciones de alto coste. Pero la inferencia crecerá con cada usuario, agente y aplicación empresarial. Si Qualcomm logra reducir coste y consumo en esa capa, puede encontrar un hueco aunque no lidere el entrenamiento.

Meta, Microsoft y los hiperescalares dan contexto al anuncio

El acuerdo con Meta es el dato comercial más visible. Qualcomm Dragonfly C1000 está previsto para alimentar parte de la futura flota de servidores de Meta, con producción desde la segunda mitad de 2028. Mark Zuckerberg vinculó la colaboración a la infraestructura necesaria para llevar “superinteligencia personal” a escala global, una frase ambiciosa, pero útil para entender la magnitud de las inversiones de Meta en IA.

Reuters también informó de que Microsoft utilizará chips HBC de Qualcomm para tareas de IA y de que la compañía cuenta con dos clientes hiperescalares no identificados para silicio personalizado. Qualcomm espera generar 5.000 millones de dólares en ingresos de centros de datos en el año fiscal 2027 y 15.000 millones en 2029, según esa misma información. Para una empresa todavía muy asociada al smartphone, esas cifras explican por qué el data center se ha convertido en prioridad estratégica.

Cliente o socio	Lectura estratégica
Meta	Valida Dragonfly C1000 como CPU de centro de datos
Microsoft	Da entrada a HBC en cargas de IA, según Reuters
Hiperescalares no identificados	Refuerzan el negocio de silicio personalizado
Hugging Face	Conecta modelos abiertos y desarrolladores con plataformas Qualcomm
Modular	Refuerza software, portabilidad y despliegue de IA
Más de 35 socios	Señal de apoyo de fabricantes, memoria, redes, servidores y cloud

El apoyo de más de 35 empresas del sector, entre ellas nombres vinculados a servidores, memoria, redes, almacenamiento y fabricación, ayuda a construir una historia de plataforma. En centros de datos, nadie gana solo. Hacen falta placas, memoria, racks, refrigeración, validación, sistemas de red, almacenamiento, integradores y clientes que acepten desplegar en volumen.

El reto: competir contra ecosistemas muy asentados

Qualcomm no entra en un mercado vacío. NVIDIA tiene GPUs, Grace, redes, CUDA, NVLink, sistemas completos y una comunidad enorme. AMD compite con EPYC e Instinct. Intel mantiene Xeon y aceleradores propios. Amazon, Google y Microsoft tienen CPUs o aceleradores internos. Broadcom y Marvell ganan terreno en ASIC personalizados. Cerebras, SambaNova, Groq y otros actores buscan nichos concretos.

La ventaja de Qualcomm puede estar en eficiencia, integración y coste. Su experiencia en dispositivos móviles le ha obligado durante décadas a pensar en rendimiento por vatio, memoria eficiente y diseño de sistema. El problema es que el centro de datos exige otra escala: fiabilidad, soporte empresarial, ciclos de validación largos, software, compatibilidad, seguridad, observabilidad y una ejecución impecable durante años.

La compra de Modular y la ampliación de la colaboración con Hugging Face ayudan a cubrir parte de esa debilidad. Qualcomm sabe que el hardware no basta. Si los desarrolladores no pueden desplegar modelos con facilidad, si los frameworks no rinden bien o si mover cargas desde GPUs establecidas exige demasiado trabajo, la adopción será limitada.

Por qué este movimiento importa

El anuncio de Dragonfly muestra que la infraestructura de IA se está alejando de una visión centrada solo en GPUs de entrenamiento. La inferencia, los agentes y los despliegues híbridos exigen CPUs eficientes, memoria abundante, redes rápidas, aceleradores especializados y software capaz de repartir cargas. El centro de datos de IA será más heterogéneo.

Para los hiperescalares, esa heterogeneidad es atractiva porque reduce dependencia, permite ajustar hardware a cargas concretas y mejora el coste por operación. Para Qualcomm, es una oportunidad de diversificar ingresos y escapar de la presión del mercado móvil. Para NVIDIA y otros incumbentes, es otra señal de que la competencia se moverá hacia sistemas completos y no solo hacia chips aislados.

El calendario, sin embargo, obliga a la prudencia. C1000 no llegará hasta 2028. AI300 también apunta a 2028. HBC Gen 1 empezará a muestrearse en 2027. Antes de hablar de cambio de mercado hará falta ver rendimiento independiente, disponibilidad real, software estable, despliegues en clientes y coste total medido en producción.

Qualcomm ha presentado una hoja de ruta ambiciosa, con clientes importantes y una tesis clara: la IA agéntica se decidirá por tokens por vatio. Si consigue demostrarlo en racks reales, Dragonfly puede convertirse en algo más que un rebranding de centro de datos. Puede ser la entrada más seria de Qualcomm en una infraestructura que hasta ahora le había quedado lejos.

Preguntas frecuentes

¿Qué es Qualcomm Dragonfly?
Es la nueva familia de soluciones de Qualcomm para centros de datos de inteligencia artificial, con CPUs, aceleradores de inferencia, tecnología HBC, conectividad y silicio personalizado.

¿Qué aporta Dragonfly C1000?
Es una CPU de centro de datos basada en núcleos Oryon, con más de 250 núcleos, diseño chiplet, PCIe Gen 7, CXL y foco en eficiencia para cargas de IA y agentes.

¿Qué es High Bandwidth Compute o HBC?
Es una tecnología de Qualcomm que combina cómputo y memoria cercana en una arquitectura 3D-stacked para reducir el cuello de botella de movimiento de datos y mejorar la eficiencia por token.

¿Cuándo llegarán estos productos?
HBC Gen 1 con AI250 tiene muestreo comercial previsto para mediados de 2027. Dragonfly C1000 y AI300 apuntan a disponibilidad o muestreo comercial en 2028, según la hoja de ruta anunciada.

vía: qualcomm