Amazon Web Services (AWS), compañía de Amazon.com (NASDAQ: AMZN), y NVIDIA (NASDAQ: NVDA) anunciaron hoy la incorporación de la nueva plataforma de GPU NVIDIA Blackwell a AWS. Esta iniciativa ofrece el NVIDIA GB200 Grace Blackwell Superchip y las GPUs B100 Tensor Core, extendiendo la colaboración estratégica de larga data entre las empresas para proporcionar la infraestructura, el software y los servicios más avanzados y seguros, ayudando a los clientes a desbloquear nuevas capacidades de inteligencia artificial (IA) generativa.
NVIDIA y AWS unen lo mejor de sus tecnologías, incluyendo los sistemas multi-nodo más recientes de NVIDIA basados en la plataforma NVIDIA Blackwell y el software de IA, el sistema Nitro de AWS y el servicio avanzado de gestión de claves AWS KMS, la red de escala petabit Elastic Fabric Adapter (EFA) y el hiper-escalado de clústeres de Amazon Elastic Compute Cloud (Amazon EC2) UltraCluster. Juntos, proporcionan la infraestructura y las herramientas que permiten a los clientes construir y ejecutar en tiempo real la inferencia en modelos de lenguaje de gran tamaño (LLMs) multi-trillonarios más rápido, a gran escala y a un menor costo que las GPUs de generación anterior de NVIDIA en Amazon EC2.
«La profunda colaboración entre nuestras dos organizaciones se remonta a más de 13 años, cuando juntos lanzamos la primera instancia de nube GPU en AWS, y hoy ofrecemos la gama más amplia de soluciones GPU NVIDIA para los clientes», dijo Adam Selipsky, CEO de AWS. «El procesador Grace Blackwell de próxima generación de NVIDIA marca un paso significativo hacia adelante en IA generativa y computación GPU. Cuando se combina con la potente red Elastic Fabric Adapter de AWS, el hiper-escalado de clústeres de Amazon EC2 UltraClusters y nuestras capacidades avanzadas de virtualización y seguridad del sistema Nitro, hacemos posible que los clientes construyan y ejecuten modelos de lenguaje de gran tamaño multi-trillonarios más rápido, a gran escala y más seguro que en cualquier otro lugar. Juntos, continuamos innovando para hacer de AWS el mejor lugar para ejecutar GPUs NVIDIA en la nube.»
«La IA está impulsando avances a un ritmo sin precedentes, llevando a nuevas aplicaciones, modelos de negocio e innovaciones en todas las industrias», dijo Jensen Huang, fundador y CEO de NVIDIA. «Nuestra colaboración con AWS está acelerando nuevas capacidades de IA generativa y proporcionando a los clientes una potencia informática sin precedentes para empujar los límites de lo posible.»
AWS ofrecerá la plataforma NVIDIA Blackwell, que incluye GB200 NVL72 con 72 GPUs Blackwell y 36 CPUs Grace interconectadas por NVIDIA NVLink de quinta generación. Conectados con la potente red de Amazon (EFA) y soportados por la virtualización avanzada (sistema Nitro de AWS) y el hiper-escalado de clústeres (Amazon EC2 UltraClusters), los clientes pueden escalar a miles de Superchips GB200. NVIDIA Blackwell en AWS ofrece un avance masivo en la aceleración de cargas de trabajo de inferencia para modelos de lenguaje de recursos intensivos y multi-trillonarios de parámetros.
Basándose en el éxito de las instancias EC2 P5 impulsadas por NVIDIA H100 disponibles para los clientes a través de bloques de capacidad de Amazon EC2 para ML, AWS planea ofrecer instancias EC2 con las nuevas GPUs B100 desplegadas en EC2 UltraClusters para acelerar la formación de IA generativa y la inferencia a gran escala. Los GB200 también estarán disponibles en NVIDIA DGX™ Cloud, una plataforma de IA co-desarrollada en AWS, que brinda a los desarrolladores empresariales acceso dedicado a la infraestructura y el software necesarios para construir y desplegar modelos de IA generativa avanzados. Las instancias DGX Cloud impulsadas por Blackwell en AWS acelerarán el desarrollo de IA generativa de vanguardia y LLMs que pueden alcanzar más de 1 trillón de parámetros.
Este proyecto reafirma el compromiso de AWS y NVIDIA para acelerar el desarrollo de aplicaciones de IA generativa y promover casos de uso en atención médica y ciencias de la vida, elevando la seguridad de la IA con el sistema Nitro de AWS, AWS KMS, EFA encriptada y la encriptación Blackwell. Con el Proyecto Ceiba, NVIDIA y AWS buscan avanzar en la innovación de la IA generativa al construir uno de los superordenadores de IA más rápidos del mundo, alojado exclusivamente en AWS. Este superordenador sin precedentes, disponible para la investigación y desarrollo de NVIDIA, utilizará el sistema GB200 NVL72, que cuenta con 20,736 GPUs B200 conectadas a 10,368 CPUs NVIDIA Grace, interconectadas a través de la red de cuarta generación EFA, proporcionando hasta 800 Gbps por Superchip de baja latencia, alta banda ancha de red —capaz de procesar un masivo 414 exaflopsUn exaflop es una unidad de medida en supercomputación que ... de IA—, un aumento de rendimiento 6 veces superior a los planes anteriores de construir Ceiba sobre la arquitectura Hopper. Los equipos de investigación y desarrollo de NVIDIA utilizarán Ceiba para avanzar en IA para LLMs, gráficos (generación de imagen/video/3D) y simulación, biología digital, robótica, autos autónomos, predicción climática NVIDIA Earth-2 y más para ayudar a NVIDIA a impulsar futuras innovaciones en IA generativa.
Además, AWS y NVIDIA colaboran para acelerar el desarrollo de aplicaciones de IA generativa y avanzar en casos de uso en atención médica y ciencias de la vida. Unen fuerzas para ofrecer infraestructura de alta performance, bajo costo para inferencia de IA generativa con la integración de Amazon SageMaker con los microservicios de inferencia de NVIDIA NIM™, disponibles con NVIDIA AI Enterprise. Los clientes pueden usar esta combinación para desplegar rápidamente Modelos Fundacionales (FMs) pre-compilados y optimizados para ejecutarse en GPUs NVIDIA en SageMaker, reduciendo el tiempo de comercialización de aplicaciones de IA generativa.
AWS y NVIDIA también han formado equipo para expandir el descubrimiento de fármacos asistido por computadora con nuevos FMs de NVIDIA BioNeMo™ para química generativa, predicción de estructura de proteínas y comprensión de cómo los fármacos interactúan con objetivos. Estos nuevos modelos pronto estarán disponibles en AWS HealthOmics, un servicio diseñado específicamente que ayuda a organizaciones de atención médica y ciencias de la vida a almacenar, consultar y analizar datos genómicos, transcriptómicos y otros datos omicos.
Los equipos de AWS HealthOmics y NVIDIA Healthcare también están trabajando juntos para lanzar microservicios de IA generativa para avanzar en el descubrimiento de fármacos, medtech y salud digital, proporcionando un nuevo catálogo de endpoints de nube acelerados por GPU para biología, química, imágenes y datos de salud, para que las empresas de atención médica puedan aprovechar los últimos avances en IA generativa en AWS.