NVIDIA supera expectativas con su Chip B200 para IA: Potencia y desafíos en el camino

NVIDIA ha desvelado recientemente su chip B200 para aplicaciones de inteligencia artificial (IA), una pieza de tecnología que promete transformar el panorama del cómputo avanzado. Anunciado en marzo de este año, el B200 se presenta como una auténtica bestia tecnológica con características que superan las expectativas de los más optimistas en el sector.

El chip B200 cuenta con impresionantes especificaciones, que incluyen 208.000 millones de transistores, la arquitectura Blackwell de última generación, y un rendimiento máximo de 20 petaFLOPS en operaciones FP4 cuando se utiliza con refrigeración líquida. Además, soporta un mapa de memoria de hasta 192 GB de VRAM y alcanza un ancho de banda de 8 TB/s, estableciendo nuevos estándares en la capacidad de procesamiento para tareas de IA.

A pesar de estas notables especificaciones, el Departamento de Comercio de EE.UU., bajo la dirección de Gina Raimondo, ha impuesto restricciones a NVIDIA, limitando la venta de esta GPU en China debido a su alto rendimiento. No obstante, NVIDIA ha confirmado que la producción a gran escala del chip B200 comenzará en el cuarto trimestre de 2024, con las primeras entregas previstas para finales de este año.

La fabricación del chip B200 no ha estado exenta de dificultades. NVIDIA ha admitido que enfrentó desafíos significativos en los procesos de producción, lo que llevó a la compañía a rediseñar algunas capas del chip para mejorar su rendimiento. «Nos vimos obligados a introducir un cambio en la máscara de la GPU Blackwell para mejorar el rendimiento de la producción», explicó NVIDIA en un comunicado oficial.

Sin embargo, estos ajustes parecen haber dado resultado. Según los datos preliminares publicados por NVIDIA, el chip B200 multiplica por cuatro el rendimiento de su predecesor, la GPU H100 basada en la microarquitectura Hopper. En pruebas realizadas con MLPerf 4.1, el B200 mostró un rendimiento de 10.755 tokens por segundo en inferencias y 11.264 tokens por segundo en pruebas de referencia offline, lo que subraya su capacidad sin igual en el mercado.

El B200 se integrará en la plataforma NVIDIA DGX B200, que ofrece un rendimiento revolucionario con su configuración de ocho GPUs Blackwell interconectadas mediante la quinta generación de NVIDIA NVLink. Esta plataforma es capaz de gestionar modelos lingüísticos de gran tamaño, sistemas de recomendación y chatbots, proporcionando un incremento del rendimiento de entrenamiento por tres y de inferencia por 15 en comparación con generaciones anteriores.

La DGX B200 está equipada con 1440 GB de memoria de GPU y alcanza un rendimiento de 72 petaFLOPS en entrenamiento y 144 petaFLOPS en inferencia. Con un consumo de energía de aproximadamente 14,3 kW, la plataforma incluye procesadores Intel Xeon Platinum, almacenamiento NVMe y un robusto soporte de redes, incluyendo InfiniBand y Ethernet de hasta 400 Gb/s.

Especificaciones Detalladas de NVIDIA DGX B200:

  • Tarjeta Gráfica (GPU): 8 GPUs NVIDIA Blackwell.
  • Memoria de GPU: Total de 1440 GB de memoria de GPU.
  • Rendimiento: 72 petaFLOPS en entrenamiento y 144 petaFLOPS en inferencia.
  • Consumo de Energía: Aproximadamente 14,3 kW.
  • CPU: 2 Procesadores Intel® Xeon® Platinum 8570, con 112 núcleos en total (2,1 GHz base, 4 GHz impulso máximo).
  • Memoria del Sistema: Hasta 4 TB.
  • Redes:
    • 4 puertos OSFP para 8 VPI NVIDIA ConnectX-7 de un solo puerto (InfiniBand/Ethernet de hasta 400 Gb/s).
    • 2 DPU de doble puerto QSFP112 NVIDIA BlueField-3 (InfiniBand/Ethernet de hasta 400 Gb/s).
    • NIC integrada de 10 Gb/s con RJ45.
    • NIC Ethernet de doble puerto de 100 Gb/s.
  • Almacenamiento:
    • Sistema Operativo: 2 NVMe M.2 de 1,9 TB.
    • Almacenamiento Interno: 8 NVMe U.2 de 3,84 TB.
  • Software:
    • NVIDIA AI Enterprise: software de IA optimizado.
    • NVIDIA Base Command™: orquestación, programación y gestión de clústeres.
    • DGX OS/Ubuntu: sistema operativo.
  • Rack Units (RU): 10 RU.
  • Dimensiones del Sistema: Altura: 444 mm, Ancho: 482,2 mm, Longitud: 897,1 mm.
  • Temperatura Operativa: 5–30 °C.
  • Soporte Empresarial: Soporte técnico empresarial durante tres años para hardware y software, portal de soporte ininterrumpido y soporte de un agente en directo durante el horario comercial local.

En resumen, el chip B200 de NVIDIA representa un avance monumental en la tecnología de IA, aunque no sin sus retos en la producción. Con su potencia sin precedentes, promete establecer nuevos estándares en el procesamiento de datos y la inteligencia artificial, mientras que la competencia en el sector, incluyendo a AMD y Huawei, seguramente se preparará para responder a esta formidable oferta de NVIDIA.

Más información: Nvidia B200

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Subscription Form (#5)

LO ÚLTIMO