Broadcom y NVIDIA anuncian nuevas capacidades para VMware Private AI Foundation

En el marco de VMware Explore 2024, Broadcom y NVIDIA han desvelado una serie de nuevas capacidades para su plataforma conjunta, VMware Private AI Foundation con NVIDIA, que se lanzará oficialmente en mayo de 2024. Esta solución de inteligencia artificial generativa está diseñada para ofrecer una infraestructura privada y segura para empresas, enfocándose en la privacidad, flexibilidad, rendimiento y seguridad.

Nuevas Funcionalidades con VMware Cloud Foundation 5.2.1

Vmware AI marketecture 1 scaled

El lanzamiento de VMware Cloud Foundation (VCF) 5.2.1, previsto para finales de año, incluirá varias capacidades nuevas que mejorarán la experiencia de los usuarios de VMware Private AI Foundation con NVIDIA:

  • Model Store: Esta funcionalidad permitirá a los equipos de MLOps y científicos de datos curar y proporcionar modelos de lenguaje grande (LLMs) de forma segura, con control de acceso integrado. El Model Store mejorará la gobernanza y la seguridad del entorno, garantizando la privacidad de los datos empresariales e IP.
  • Guided Deployment: Para simplificar el proceso de despliegue de Gen AI, esta nueva capacidad optimiza la creación de dominios de carga de trabajo y el despliegue de componentes adicionales, acelerando el tiempo de implementación y reduciendo el esfuerzo administrativo.

Capacidades de NVIDIA AI Enterprise

  • NVIDIA NIM Agent Blueprints: Estos flujos de trabajo de referencia permiten a las empresas construir sus propias soluciones de IA generativa. Incluyen herramientas necesarias para desarrollar aplicaciones personalizadas, como flujos de trabajo para servicio al cliente, descubrimiento de fármacos y extracción de datos de PDFs.
  • NVIDIA NIM: Un conjunto de microservicios diseñados para la implementación segura y fiable de modelos de IA de alto rendimiento. Los NIM microservicios soportan una amplia gama de modelos de IA y se integran fácilmente en aplicaciones empresariales con simples comandos.
  • NVIDIA NIM Operator: Facilita la implementación y gestión de pipelines de IA generativa mediante la automatización del despliegue, escalado y gestión de inferencias, reduciendo la latencia y mejorando el rendimiento de escalado automático.
cluster GPU allocation scaled

Capacidades Futuras

Broadcom también ha anunciado capacidades adicionales para futuras versiones de VMware Private AI Foundation con NVIDIA:

  • Visibilidad del Perfil vGPU: Permite a los administradores ver todos los vGPUs creados a través de una interfaz en vCenter, eliminando la necesidad de seguimiento manual y mejorando la eficiencia operativa.
  • Reservas de GPU: Esta nueva función permitirá a los administradores reservar recursos para vGPUs con anticipación, mejorando la planificación de capacidad y el rendimiento.
  • Servicio de Indexación y Recuperación de Datos: Facilitando la preparación de datos privados para IA generativa, esta función permitirá indexar y vectorizar fuentes de datos privadas, mejorando la calidad de los resultados de Gen AI.
  • AI Agent Builder Service: Ayudará a los desarrolladores y científicos de datos a construir y desplegar agentes de IA personalizados utilizando LLMs y datos del servicio de indexación y recuperación de datos.

Expansión del Ecosistema

Broadcom también está ampliando el ecosistema de VMware Private AI Foundation con NVIDIA al añadir nuevos proveedores y socios, incluyendo:

  • Codeium: Ofrece asistencia en la generación y depuración de código mediante IA, mejorando la eficiencia del desarrollo.
  • HCLTech: Proporciona soluciones de Gen AI personalizadas para acelerar la adopción de Gen AI con un modelo de precios ajustado.
  • Tabnine: Herramientas de IA personalizadas para desarrollo de software, manteniendo la privacidad y el control.
  • WWT: Proveedor de soluciones tecnológicas que apoya a las empresas en la implementación y operación de aplicaciones de IA.

La colaboración entre Broadcom y NVIDIA en la plataforma VMware Private AI Foundation representa un avance significativo en la infraestructura de IA generativa para empresas, ofreciendo nuevas herramientas y capacidades para mejorar la eficiencia y la seguridad en el manejo de datos y aplicaciones de IA.

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Subscription Form (#5)

LO ÚLTIMO