Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

Oracle lanza el supercluster más grande del mundo para IA con GPUs Nvidia H200

Oracle ha anunciado la disponibilidad general de su nuevo supercluster de Oracle Cloud Infrastructure (OCI), equipado con las potentes GPUs Nvidia H200. Este supercluster, que puede escalar hasta 65.536 GPUs H200, promete un rendimiento sin precedentes para aplicaciones de inteligencia artificial (IA), alcanzando hasta 260 exaflops de rendimiento máximo en precisión FP8, según ha comunicado la compañía.

La infraestructura más grande de IA en la nube

Oracle afirma que este supercluster es actualmente el superordenador más grande basado en la nube para IA. Cada instancia de cómputo dentro del supercluster ofrece un 76 % más de memoria de alta velocidad y un 40 % más de ancho de banda de memoria en comparación con las instancias H100, lo que mejora el rendimiento de inferencia en modelos de lenguaje grande (LLM) hasta en 1,9 veces.

El sistema cuenta con una red de clúster personalizada basada en RDMA sobre Ethernet Convergente Versión 2 (RoCE v2), que utiliza tarjetas de interfaz de red Nvidia ConnectX-7. Esta arquitectura permite interconexiones entre GPUs de hasta 400 Gbps, mientras que su red frontal de 200 Gbps facilita la transferencia eficiente de grandes conjuntos de datos entre el almacenamiento y las GPUs.

Cada instancia bare metal está equipada con ocho GPUs Nvidia H200 con 141 GB de memoria HBM3e, junto con dos CPUs Intel Sapphire Rapids 8480+ de 56 núcleos.

Costes accesibles y rendimiento mejorado

Oracle mantiene su política de precios competitiva: 10 dólares por GPU por hora, el mismo costo que las instancias con H100. Esto ofrece a las empresas un acceso más asequible a una infraestructura de IA de vanguardia.

El supercluster también supera a su predecesor H100, que podía escalar hasta 16.384 GPUs, consolidándose como una opción ideal para cargas de trabajo masivas como el entrenamiento y la inferencia de modelos de IA de última generación.

Mirando hacia el futuro: Nvidia Blackwell

En septiembre de 2024, Oracle reveló sus planes para construir un supercluster aún más avanzado, que contará con hasta 131.072 GPUs Nvidia Blackwell, programadas para lanzarse en la primera mitad de 2025. Este desarrollo representa el compromiso continuo de Oracle por liderar la innovación en computación en la nube para IA.

Un salto hacia la próxima generación de IA

El supercluster de Oracle con Nvidia H200 redefine los límites de la computación en la nube para aplicaciones de inteligencia artificial. Gracias a su rendimiento escalable y costos competitivos, se posiciona como una herramienta clave para empresas que buscan aprovechar la IA para resolver problemas complejos, desde el análisis de datos hasta la generación de modelos de lenguaje avanzados.

Con esta infraestructura, Oracle no solo responde a las demandas actuales de procesamiento masivo, sino que también sienta las bases para los avances futuros en IA y computación de alto rendimiento.

vía: DCD

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO