Red Hat AI Factory con NVIDIA acelera el camino hacia la IA de producción escalable

Red Hat, líder mundial en soluciones de código abierto, ha lanzado Red Hat AI Factory con NVIDIA, una plataforma de software desarrollada conjuntamente que integra Red Hat AI Enterprise y NVIDIA AI Enterprise. Esta solución proporciona un enfoque integral de IA, optimizado para organizaciones que implementan inteligencia artificial a gran escala. La presentación de Red Hat AI Factory con NVIDIA refuerza la colaboración entre ambas compañías, acelerando la disponibilidad de innovaciones en IA para clientes empresariales desde hoy, con soporte desde el primer día para arquitecturas de hardware de NVIDIA.

Se espera que el gasto en IA empresarial supere el billón de dólares para 2029, impulsado en gran medida por las aplicaciones de IA agéntica. Ante este escenario, las empresas buscan soluciones que gestionen flujos de trabajo agénticos de alta densidad y las crecientes demandas de infraestructura e inferencia de IA. La nueva plataforma permite a los equipos de TI optimizar la administración tanto de la infraestructura tradicional como de los requisitos dinámicos del ecosistema de IA.

Red Hat AI Factory con NVIDIA acelera la adopción de IA en producción al ofrecer una plataforma integral para fábricas de IA, operando sobre infraestructura de computación acelerada que mejora el rendimiento de los modelos y de las GPU de NVIDIA encargadas del procesamiento de inferencia. La plataforma es compatible con la infraestructura de fábrica de IA de fabricantes líderes como Cisco, Dell Technologies, Lenovo y Supermicro, lo que facilita a los responsables de TI y equipos de operaciones escalar y mantener los despliegues de IA con la misma previsibilidad y rigor que cualquier otra carga de trabajo empresarial.

Esta plataforma de software co-diseñada integra la experiencia en colaboración de código abierto, ingeniería y soporte tanto de Red Hat como de NVIDIA para ofrecer una solución empresarial fiable. Red Hat AI Factory con NVIDIA proporciona una base altamente escalable para los despliegues de IA en cualquier entorno, ya sea en on-premises, en la nube o en el edge. Incluye capacidades esenciales para la inferencia de IA de alto rendimiento, el ajuste de modelos, la personalización y el despliegue y la gestión de agentes, con un enfoque en la seguridad. Esto permite a las organizaciones mantener el control arquitectónico desde el centro de datos hasta la nube pública, lo que se traduce en:

  • Acortamiento del tiempo para obtener valor: esta solución facilita el avance hacia la IA de producción con flujos de trabajo optimizados y acceso instantáneo a modelos preconfigurados, incluyendo la familia IBM Granite con respaldo legal, NVIDIA Nemotron, y los modelos abiertos NVIDIA Cosmos, que se entregan como NVIDIA NIM microservices. Además, permite a las organizaciones una mayor alineación de los modelos con los datos empresariales utilizando NVIDIA NeMo, reduciendo el tiempo y el costo de ajuste.
  • Rendimiento y coste optimizados: optimiza el uso de la infraestructura y se potencia el rendimiento de la inferencia con un stack de servicio unificado y de alto rendimiento. Red Hat AI Factory con NVIDIA ofrece capacidades de observabilidad integradas y aprovecha las capacidades de inferencia de Red Hat AI impulsadas por vLLM, NVIDIA TensorRT-LLM, y NVIDIA Dynamo para cumplir con estrictos objetivos de nivel de servicio de IA. De esta forma, se ayuda a las organizaciones a reducir el coste total de propiedad (TCO) para la IA optimizando la conexión entre los modelos y las GPU de NVIDIA.
  • Orquestación inteligente de GPU: habilita el acceso bajo demanda a los recursos de GPU a través de la orquestación inteligente y la infraestructura agrupada, con puntos de control automáticos para proteger los trabajos de larga duración y mantener costes de cómputo más predecibles en entornos dinámicos.
  • Seguridad empresarial reforzada: Aprovechando la base flexible y estable de Red Hat Enterprise Linux, las organizaciones se benefician de capacidades avanzadas de seguridad y cumplimiento integradas desde el principio, lo que contribuyen a reducir el riesgo, ahorrar tiempo y mitigar el tiempo de inactividad. Esto proporciona una base reforzada en seguridad para cargas de trabajo de IA de misión crítica que requieren aislamiento y verificación continua. Los microservicios NVIDIA DOCA se basan en esta base, creando una arquitectura de confianza cero y brindando seguridad de tiempo de ejecución de IA en toda la infraestructura.

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO

Las últimas novedades de tecnología y cloud

Suscríbete gratis al boletín de Revista Cloud. Cada semana la actualidad en tu buzón.

Suscripción boletín
×