Durante la celebración del Red Hat Summit, Red Hat y AMD anunciaron una ampliación de su colaboración estratégica con el objetivo de ofrecer soluciones más eficientes en IA generativa y modernizar infraestructuras virtualizadas en entornos híbridos. La combinación de tecnologías abiertas de Red Hat con la potencia de los procesadores AMD EPYC y las GPU AMD Instinct pretende optimizar tanto el rendimiento como la escalabilidad de cargas de trabajo cada vez más diversas y exigentes.
AMD Instinct y Red Hat OpenShift AI: inferencia optimizada en la nube híbrida
Uno de los principales anuncios ha sido la plena integración de las GPU AMD Instinct en Red Hat OpenShift AI, lo que permitirá a las organizaciones desplegar modelos de inteligencia artificial de forma más eficiente sin necesidad de recursos extremos. En pruebas realizadas en Microsoft Azure, Red Hat y AMD demostraron que es posible escalar modelos de lenguaje (SLM y LLM) dentro de una única máquina virtual con múltiples GPU, reduciendo los costes de rendimiento al evitar la fragmentación de recursos entre varias VMs.
Gracias al uso de las GPU AMD Instinct MI300X y la plataforma Red Hat Enterprise Linux AI, la alianza ha mostrado un entorno de inferencia robusto, eficiente y compatible con arquitecturas abiertas.
Colaboración en vLLM: inferencia de IA más eficiente con GPU AMD
Ambas compañías también anunciaron su trabajo conjunto en el ecosistema de vLLM (vectorized LLM), con contribuciones directas al proyecto upstream para acelerar la inferencia de modelos de lenguaje. Entre las mejoras anunciadas destacan:
- Mejoras en el rendimiento sobre GPUs AMD mediante la incorporación del AMD kernel library, optimización del kernel Triton y soporte de FP8 para modelos densos y cuantizados.
- Soporte mejorado para sistemas multi-GPU, lo que permite una ejecución más escalable y energéticamente eficiente en entornos distribuidos.
- Ampliación del ecosistema vLLM, con la participación de otros actores como IBM, que refuerzan el desarrollo continuo del proyecto y su compatibilidad con hardware AMD.
Como resultado de esta colaboración, las GPUs AMD Instinct soportarán de forma nativa el Red Hat AI Inference Server, la distribución empresarial de vLLM, facilitando la ejecución de modelos de código abierto sobre hardware validado y optimizado.
EPYC y OpenShift Virtualization: modernización sin fricciones
Red Hat también destacó la validación de Red Hat OpenShift Virtualization para procesadores AMD EPYC, lo que permite a las organizaciones unificar cargas de trabajo de máquinas virtuales y contenedores en una misma plataforma nativa en la nube. Esta capacidad es clave para actualizar centros de datos tradicionales, consolidar infraestructura y reducir el TCO (coste total de propiedad) en términos de hardware, licencias y energía.
AMD EPYC se posiciona así como la plataforma ideal para alojar sistemas habilitados con GPU, mejorando el retorno de inversión incluso para cargas de IA altamente exigentes. Entre los servidores compatibles con esta tecnología se encuentran soluciones de Dell PowerEdge, HPE ProLiant y Lenovo ThinkSystem.
Declaraciones oficiales
Ashesh Badani, vicepresidente sénior y jefe de producto de Red Hat, afirmó:
«Aprovechar los beneficios reales de la IA requiere flexibilidad y capacidad para escalar. Esta colaboración con AMD amplía las opciones disponibles para modernizar infraestructuras y preparar entornos de producción con aceleradores de última generación y tecnologías de código abierto.»
Por su parte, Philip Guido, director comercial de AMD, declaró:
«La combinación de las plataformas abiertas de Red Hat con nuestras GPU Instinct y CPUs EPYC proporciona el rendimiento y la eficiencia que demandan nuestros clientes para acelerar la innovación en IA, virtualización y cloud híbrida.»
vía: AMD