Oracle ha presentado en AI World su mayor salto en infraestructura para IA y un giro relevante en consumo multicloud:
- OCI Zettascale10: un superclúster que entrega hasta 16 zettaFLOPS de rendimiento pico en clusters multigigavatio y escala hasta 800.000 GPUs NVIDIA por despliegue, unidos a través de varios centros de datos.
- Oracle Acceleron RoCE: nuevo tejido de red Ethernet con RDMA que aplanza la topología, baja la latencia GPU-a-GPU, añade resiliencia por planos aislados y aplica cifrado a velocidad de línea con políticas zero-trust (ZPR) en la propia NIC.
- Oracle Multicloud Universal Credits: un modelo único de consumo y licencias para Oracle Database y servicios de OCI que se puede usar indistintamente en Oracle Database@AWS, @Azure, @Google Cloud y en OCI, con contratos y gobernanza consistentes entre nubes. Oracle suma ya 37 regiones multicloud activas con AWS, Azure y Google Cloud.
“Con Zettascale10 fusionamos la arquitectura de red Oracle Acceleron RoCE con infraestructura de IA de nueva generación para entregar capacidad multigigavatio a una escala sin precedentes”, dijo Mahesh Thiagarajan, EVP de OCI.
Zettascale10: más que zettaFLOPS
- Arquitectura distribuida: el superclúster se reparte en varios data centers densos, interconectados por fibra de alta capacidad. El primer despliegue opera en Abilene (Texas).
- Objetivo: entrenar e inferir modelos de IA extremadamente grandes con latencia GPU-a-GPU uniforme y rendimiento predecible.
Acceleron RoCE: RDMA sobre Ethernet “ancho y poco profundo”
- NICs con conmutador integrado (4 puertos): cada GPU NIC actúa como mini-switch, conectándose a múltiples planos de red físicos y lógicos aislados.
- Menos saltos, menos colas: topología más plana → latencia inferior y más regular entre GPUs; reducción de atascos y restarts por checkpoints.
- Resiliencia operativa: si un plano se congestiona o entra en mantenimiento, el tráfico se desvía sin frenar los jobs.
- Seguridad a velocidad de línea: cifrado extremo a extremo y Zero-Trust Packet Routing aplicados en la NIC, bloqueando por ejemplo accesos a object storage desde internet para evitar exfiltraciones.
- Eficiencia: potencial de duplicar capacidad de red, multiplicar IOPS de almacenamiento y bajar costes al mantener menos niveles de red.
Licencias universales multicloud: un solo contrato, varias nubes
El nuevo Oracle Multicloud Universal Credits permite comprar Oracle Database y servicios OCI con créditos reutilizables en:
- Oracle Database@AWS
- Oracle Database@Azure
- Oracle Database@Google Cloud
- OCI (nativo)
Beneficios:
- Un contrato y gobierno comunes para despliegues híbridos/multicloud.
- Mismo modelo de consumo entre nubes: menos fricción comercial y elección real de ubicación.
- Encaje con las 37 regiones multicloud ya operativas.
“Con Multicloud Universal Credits introducimos el primer modelo de consumo cruzado entre nubes del sector, simplificando contratos y dando más flexibilidad que nunca,” afirmó Karan Batta, SVP de OCI.
Por qué importa (para equipos de IA y arquitectura cloud)
- Escala de entrenamiento: hasta 800.000 GPUs por clúster, con RDMA de muy baja latencia y topología plana: menos stragglers, más STP (procesamiento directo sin intervención).
- Predecibilidad: latencias GPU-a-GPU más uniformes, menos reinicios por fallos de red y mantenimiento por plano sin parar trabajos.
- Seguridad integrada: ZPR en NIC y cifrado a línea reducen superficie de ataque y riesgo de exfiltración.
- Multicloud de facto: licencias portables para base de datos y servicios OCI en AWS/Azure/GCP/OCI con gobierno único.
Detalles técnicos clave (de un vistazo)
- Rendimiento: hasta 16 zettaFLOPS por superclúster Zettascale10.
- Interconexión: InfiniBand y Acceleron RoCE (RDMA sobre Ethernet) con planos aislados y cifrado line-rate.
- Operación: mantenimiento por plano, menos niveles de red, políticas zero-trust en host/NIC.
- Disponibilidad: Zettascale10 se ofrece como superclúster con hasta 800.000 GPUs; el primer emplazamiento es Abilene (TX).
Preguntas rápidas
¿Zettascale10 requiere hardware especializado?
Oracle combina InfiniBand para HPC clásico y Acceleron RoCE (Ethernet RDMA con NICs/switching específicos) para escalar IA con latencia muy baja sin depender solo de IB.
¿Qué gano frente a un clúster GPU “tradicional”?
Menos saltos de red, latencia más estable, resiliencia por planos, cifrado y ZT en la NIC y despliegues rápidos de clústeres muy grandes.
¿En qué cambia el modelo de licencias?
Con Universal Credits contratas una vez y consumes Oracle Database/OCI donde quieras (AWS/Azure/GCP/OCI) con gobernanza y contratos consistentes.
¿Para qué cargas está pensado?
Entrenamiento/serving de modelos fundacionales gigantes, multimodal, MoE, RAG a gran escala y HPC que exigen RDMA y red homogénea de muy baja latencia.
En síntesis: Oracle convierte a OCI en una plataforma de IA a escala zettascale con un tejido RDMA propio (Acceleron RoCE) y simplifica el consumo multicloud con licencias universales. Para organizaciones que buscan pasar de POCs a IA industrializada en varias nubes, la combinación de rendimiento, seguridad integrada y flexibilidad contractual es el punto diferencial.
vía: oracle