NVIDIA ha anunciado su supercomputadora de IA de próxima generación, el NVIDIA DGX SuperPOD™ impulsado por los Superchips NVIDIA GB200 Grace Blackwell, diseñado para procesar modelos de trillones de parámetros con un tiempo de actividad constante para cargas de trabajo de entrenamiento e inferencia de IA generativa a gran escala.
Dotado de una arquitectura de escala de rack líquida altamente eficiente, el nuevo DGX SuperPOD está construido con sistemas NVIDIA DGX™ GB200 y proporciona 11.5 exaflopsUn exaflop es una unidad de medida en supercomputación que ... de supercomputación en IA con precisión FP4 y 240 terabytes de memoria rápida, escalando aún más con racks adicionales.
Cada sistema DGX GB200 cuenta con 36 NVIDIA GB200 Superchips, que incluyen 36 CPUs NVIDIA Grace y 72 GPUs NVIDIA Blackwell, conectados como un superordenador a través de la quinta generación de NVIDIA NVLink®. Los Superchips GB200 ofrecen hasta un aumento de rendimiento de 30 veces en comparación con la GPU NVIDIA H100 Tensor Core para cargas de trabajo de inferencia de modelos de lenguaje grande.
«Las supercomputadoras NVIDIA DGX son las fábricas de la revolución industrial de la IA,» dijo Jensen Huang, fundador y CEO de NVIDIA. «El nuevo DGX SuperPOD combina los últimos avances en computación acelerada, redes y software de NVIDIA para permitir que cada empresa, industria y país perfeccione y genere su propia IA.»
El DGX SuperPOD, impulsado por Grace Blackwell, cuenta con ocho o más sistemas DGX GB200 y puede escalar a decenas de miles de Superchips GB200 conectados a través de NVIDIA Quantum InfiniBand. Para un espacio de memoria compartida masivo necesario para alimentar los modelos de IA de próxima generación, los clientes pueden implementar una configuración que conecte las 576 GPUs Blackwell en ocho sistemas DGX GB200 conectados a través de NVLink.
Nueva arquitectura DGX SuperPOD para la era de la IA generativa
El nuevo DGX SuperPOD con sistemas DGX GB200 presenta una tela de cómputo unificada. Además de la quinta generación de NVIDIA NVLink, la tela incluye DPUs NVIDIA BlueField®-3 y admitirá la red NVIDIA Quantum-X800 InfiniBand, anunciada hoy por separado. Esta arquitectura proporciona hasta 1,800 gigabytes por segundo de ancho de bandaEl ancho de banda es la capacidad máxima de transferencia d... a cada GPU en la plataforma.
Además, la tecnología de Protocolo de Agregación y Reducción Jerárquica Escalable (SHARP)™ de cuarta generación proporciona 14.4 teraflops de Computación en Red, un aumento de 4 veces en la arquitectura DGX SuperPOD de próxima generación en comparación con la generación anterior.
Arquitectura llave en mano con software avanzado para un tiempo de actividad sin precedentes
El nuevo DGX SuperPOD es una supercomputadora de IA completa a escala de centro de datosUn centro de datos o centro de procesamiento de datos (CPD) ... que se integra con almacenamiento de alto rendimiento de socios certificados por NVIDIA para satisfacer las demandas de las cargas de trabajo de IA generativa. Cada uno se construye, se cablea y se prueba en fábrica para acelerar drásticamente la implementación en los centros de datos de los clientes.
El DGX SuperPOD, impulsado por Grace Blackwell, cuenta con capacidades inteligentes de gestión predictiva para monitorear continuamente miles de puntos de datos en hardware y software para predecir e interceptar fuentes de tiempo de inactividad e ineficiencia, ahorrando tiempo, energía y costos de cómputo.
El software puede identificar áreas de preocupación y planificar el mantenimiento, ajustar flexiblemente los recursos de cómputo y guardar y reanudar automáticamente los trabajos para prevenir el tiempo de inactividad, incluso sin la presencia de administradores de sistemas.
Sistemas NVIDIA DGX B200 avanzan la supercomputación en IA para las industrias
NVIDIA también presentó el sistema NVIDIA DGX B200, una plataforma de supercomputación en IA unificada para entrenamiento de modelos de IA, afinamiento e inferencia.