El mercado de GPU para centros de datos entra en la década de la IA

Antonio

Las GPU para centros de datos han dejado de ser un componente especializado para convertirse en una de las piezas más disputadas de la infraestructura digital. La inteligencia artificial generativa, el entrenamiento de modelos, la inferencia a gran escala, la analítica avanzada, la simulación científica y los servicios cloud están empujando una demanda que ya no afecta solo a fabricantes de chips. También arrastra a proveedores cloud, integradores de servidores, fabricantes de redes, empresas de refrigeración, operadores de centros de datos y compañías eléctricas.

La infografía que acompaña al informe resume bien el cambio: NVIDIA domina la conversación, pero el mercado ya no puede entenderse como una simple carrera entre fabricantes de tarjetas. AMD, Intel, Huawei, Cerebras, SambaNova y otros actores compiten en distintas capas; los hiperescalares compran capacidad de forma masiva; los OEM como Dell, HPE, Lenovo, Supermicro, QCT, Gigabyte o ASUS empaquetan esos aceleradores en servidores; y el software, desde CUDA hasta ROCm, oneAPI, OpenShift AI, SUSE o Ubuntu, decide buena parte de la experiencia real del cliente.

Las previsiones de mercado varían mucho según la consultora, algo lógico en un sector que está creciendo más rápido de lo que muchos modelos estadísticos pueden capturar. Market.us estima que el mercado global de GPU para centros de datos podría pasar de unos 18.000 millones de dólares en 2024 a 183.000 millones en 2034. Precedence Research lo sitúa en 21.770 millones en 2025 y proyecta 226.870 millones en 2035. Future Market Insights habla de 21.600 millones en 2025 y 265.500 millones en 2035, mientras que SNS Insider eleva su previsión hasta 284.800 millones en 2035. Las cifras no coinciden, pero la dirección sí: la década de 2025 a 2035 será una década de crecimiento intenso para el cómputo acelerado.

NVIDIA lidera, pero la competencia se mueve por capas

NVIDIA sigue siendo el actor central. Sus resultados financieros muestran hasta qué punto la IA ha transformado su negocio: en el primer trimestre de su ejercicio fiscal 2027, la compañía declaró ingresos récord de 81.600 millones de dólares, con 75.200 millones procedentes del segmento de centros de datos, un 92 % más que un año antes. Esa cifra explica por qué hablar de GPU para centros de datos es hablar también de poder de mercado, disponibilidad de chips, cuellos de botella y concentración de proveedores.

Pero el mercado no se limita a NVIDIA. AMD está reforzando su línea Instinct con aceleradores como la serie MI350, orientada a IA generativa, HPC, entrenamiento, inferencia y cargas científicas. Intel mantiene su apuesta por aceleradores y ecosistema oneAPI, aunque con una posición más compleja. Huawei empuja Ascend dentro del mercado chino y en escenarios donde las restricciones estadounidenses han acelerado la búsqueda de alternativas locales. Cerebras y SambaNova juegan con arquitecturas más específicas, pensadas para cargas de IA que pueden beneficiarse de enfoques distintos a la GPU tradicional.

Capa del mercado	Actores principales	Por qué importa
GPU y aceleradores	NVIDIA, AMD, Intel, Huawei, Cerebras, SambaNova	Definen rendimiento, disponibilidad, coste y eficiencia
Cloud e hiperescalares	Microsoft Azure, AWS, Google Cloud, Meta, Oracle, Alibaba, Tencent	Compran capacidad masiva y marcan demanda global
Servidores e integración	Dell, HPE, Lenovo, Supermicro, QCT, Gigabyte, ASUS	Convierten chips en sistemas desplegables en data centers
Software y plataformas	CUDA, ROCm, oneAPI, OpenShift AI, VMware, SUSE, Ubuntu	Determinan facilidad de uso, portabilidad y adopción
Infraestructura física	Redes, energía, refrigeración, racks, almacenamiento	Decide si el clúster puede operar a escala real

La clave está en que la GPU por sí sola no basta. Un clúster de IA necesita memoria HBM, interconexión de alta velocidad, switches, almacenamiento rápido, refrigeración líquida o híbrida, software de orquestación, drivers estables y equipos capaces de operarlo. Por eso el mercado se está convirtiendo en una cadena de valor completa, no en una simple compra de tarjetas.

La demanda llega por entrenamiento, inferencia y edge

La primera ola de demanda vino del entrenamiento de grandes modelos. Entrenar un modelo fundacional exige miles o decenas de miles de aceleradores funcionando de forma coordinada, con enormes necesidades de ancho de banda, memoria y estabilidad. Esa fase sigue siendo crítica, pero la siguiente gran presión llega por la inferencia.

Cuando los modelos pasan a producción, cada consulta, cada agente, cada recomendación, cada búsqueda generativa y cada asistente empresarial consume cómputo. La inferencia puede ser menos espectacular que el entrenamiento, pero puede convertirse en una carga permanente y masiva. Si millones de usuarios y empresas integran IA en flujos diarios, la demanda de GPU ya no será puntual, sino continua.

También crece el edge. No todos los datos pueden viajar a una región cloud lejana. Industria, sanidad, retail, telecomunicaciones, ciudades inteligentes, automoción o vigilancia de infraestructuras necesitan cada vez más procesamiento cerca del origen de los datos. Ahí aparecen GPU y aceleradores para edge data centers, menos grandes que los clústeres de entrenamiento, pero diseñados para baja latencia, eficiencia energética y operación distribuida.

Tipo de GPU para centros de datos	Uso principal	Ejemplos de carga
IA y machine learning	Entrenamiento e inferencia	LLMs, visión artificial, recomendadores
HPC y cómputo científico	Simulación y cálculo intensivo	Clima, física, ingeniería, bioinformática
Inferencia	Respuesta en tiempo real	Chatbots, agentes, búsqueda, personalización
Virtualización	Puestos virtuales y renderizado	VDI, CAD, diseño, estaciones remotas
Edge data center	Procesamiento local	IoT, analítica industrial, baja latencia

El cuello de botella ya no es solo el chip

El crecimiento del mercado también trae problemas. El primero es el coste. Un rack de IA de alta densidad exige una inversión enorme en servidores, aceleradores, redes, almacenamiento, energía, refrigeración y mantenimiento. Para muchas empresas, la alternativa natural será consumir GPU desde cloud o proveedores especializados. Para otras, por razones de datos, latencia, seguridad o coste a largo plazo, tendrá sentido desplegar infraestructura propia o híbrida.

El segundo cuello de botella es energético. La Agencia Internacional de la Energía prevé que el consumo eléctrico global de los centros de datos pase de 485 TWh en 2025 a unos 950 TWh en 2030, con los centros orientados a IA creciendo aún más rápido dentro de ese total. Eso coloca la disponibilidad eléctrica, la conexión a red y la refrigeración en el centro de cualquier estrategia de GPU para data centers.

El tercer desafío es térmico. Las nuevas generaciones de GPU y aceleradores elevan la densidad por rack, lo que empuja hacia refrigeración líquida, diseños más eficientes y una planificación más cuidadosa del data center. Ya no basta con instalar servidores en una sala existente. Los clústeres de IA obligan a repensar potencia por rack, distribución eléctrica, redundancia, evacuación de calor y mantenimiento.

El cuarto punto es el software. CUDA ha dado a NVIDIA una ventaja enorme porque no es solo una API: es un ecosistema de librerías, frameworks, herramientas, documentación y talento. AMD trabaja para reforzar ROCm, Intel empuja oneAPI y los entornos empresariales necesitan capas de orquestación y compatibilidad. A largo plazo, la batalla por el software puede ser tan importante como la batalla por el silicio.

Norteamérica domina, Asia acelera y Europa busca su sitio

Norteamérica sigue liderando por la concentración de hiperescalares, capital, talento y proyectos de IA. Microsoft, AWS, Google, Meta y Oracle están construyendo o alquilando capacidad a un ritmo difícil de igualar. Asia-Pacífico crece con fuerza por China, Japón, Corea del Sur, India y el sudeste asiático, donde la construcción de data centers y la adopción de IA se aceleran.

Europa tiene una posición más incómoda. Cuenta con demanda empresarial, regulación, industrias avanzadas y ambición de soberanía digital, pero sufre más restricciones energéticas, permisos más lentos, menor disponibilidad de grandes regiones cloud propias y una dependencia significativa de proveedores externos. Al mismo tiempo, esa presión abre oportunidades para cloud privado, infraestructura soberana, centros de datos eficientes y despliegues híbridos pensados para sectores regulados.

El mercado de GPU para centros de datos no será uniforme. Los hiperescalares seguirán comprando a gran escala para entrenar y servir modelos globales. Las empresas reguladas buscarán entornos más controlados. Los proveedores regionales intentarán ofrecer GPU-as-a-Service, cloud privado o bare-metal acelerado. Y los fabricantes de servidores competirán por empaquetar soluciones completas que reduzcan el tiempo de despliegue.

La lectura de fondo es clara: la GPU se ha convertido en infraestructura económica. Igual que el servidor x86 definió una etapa del cloud, los aceleradores definirán la próxima etapa de la IA. Pero el mercado no lo ganará quien tenga solo el chip más potente, sino quien pueda entregar rendimiento, energía, refrigeración, software, disponibilidad y coste total de propiedad en equilibrio.

La década de la IA no se construirá únicamente con modelos. Se construirá con racks, cables, memoria, energía, refrigeración y plataformas capaces de convertir capacidad bruta en servicios útiles. Ahí es donde el mercado de GPU para centros de datos se juega su verdadero tamaño.

Preguntas frecuentes

¿Qué es una GPU para centros de datos?
Es un acelerador diseñado para cargas intensivas como inteligencia artificial, machine learning, HPC, inferencia, renderizado, analítica avanzada o virtualización en servidores y clústeres profesionales.

¿Por qué crece tanto este mercado?
Por la expansión de la IA generativa, los modelos de lenguaje, la inferencia en producción, el cloud, el HPC y la necesidad de procesar grandes volúmenes de datos con más eficiencia.

¿NVIDIA domina completamente el mercado?
NVIDIA lidera de forma clara, especialmente por su ecosistema CUDA y su presencia en hiperescalares, pero AMD, Intel, Huawei y otros actores intentan ganar espacio en segmentos concretos.

¿Cuál es el mayor reto para desplegar GPU en data centers?
No es solo comprar chips. Los grandes retos son energía, refrigeración, redes, suministro, coste, software, talento operativo y capacidad de mantener clústeres estables a escala.

vía: Linkedin