HPE refuerza su apuesta por la supercomputación: nueva generación HPE Cray para dominar la era de la IA y el HPC

Hewlett Packard Enterprise (HPE) ha dado un paso más en su estrategia para liderar la supercomputación de la era de la inteligencia artificial. La compañía ha presentado una ampliación de su portfolio HPE Cray Supercomputing de nueva generación, centrada en tres nuevos blades de cómputo de alta densidad, un software unificado de gestión y un sistema de interconexión y almacenamiento pensados para cargas de trabajo mixtas de IA y HPC a gran escala.

El objetivo es claro: ofrecer una arquitectura única capaz de servir por igual a centros de investigación, entidades soberanas y grandes empresas que necesitan combinar simulación científica tradicional con modelos de IA generativa cada vez más exigentes.


Una plataforma para la convergencia entre IA y HPC

La nueva generación de HPE Cray Supercomputing se construye alrededor de la plataforma GX5000, presentada recientemente y diseñada específicamente para la convergencia entre IA y HPC. Sobre esta base, HPE introduce ahora:

  • Tres blades de cómputo multi-partner y multi-workload, todos ellos refrigerados por liquid cooling directo al 100 %.
  • El HPE Supercomputing Management Software, que unifica la gestión de sistemas a lo largo de todo el ciclo de vida de la infraestructura.
  • Una versión del interconect HPE Slingshot 400 adaptada a la nueva plataforma.
  • El sistema de almacenamiento HPE Cray Supercomputing Storage Systems K3000, con software DAOS integrado de fábrica.

La compañía sostiene que, en conjunto, esta arquitectura proporciona una de las densidades de cómputo más altas de la industria, preparada para responder al crecimiento explosivo de modelos de IA, simulaciones complejas y cargas de datos masivas.


Tres blades para casi cualquier escenario de supercomputación

El corazón de la propuesta son los nuevos blades de cómputo, diseñados para ofrecer distintas combinaciones de CPUs y GPUs según el tipo de carga de trabajo:

HPE Cray Supercomputing GX440n Accelerated Blade

Pensado como un motor de cómputo “universal” para cargas de precisión mixta centradas en GPU:

  • 4 CPUs NVIDIA Vera
  • 8 GPUs NVIDIA Rubin
  • Hasta 24 blades por rack, lo que se traduce en hasta 192 GPUs Rubin por rack

Este blade está claramente orientado a quienes apuestan por el ecosistema NVIDIA para entrenamiento y despliegue de grandes modelos de IA, así como para simulaciones masivas aceleradas por GPU.

HPE Cray Supercomputing GX350a Accelerated Blade

Enfocado en quienes buscan un stack completo de AMD para IA y HPC:

  • 1 CPU AMD EPYC de nueva generación “Venice”
  • 4 GPUs AMD Instinct™ MI430X, la nueva serie MI400 orientada a IA soberana y HPC
  • Hasta 28 blades por rack, con hasta 112 GPUs MI430X por rack

Este diseño apunta a organismos que quieran reforzar la soberanía tecnológica y evitar dependencias excesivas de un único proveedor, apoyándose en la combinación de EPYC + Instinct en arquitecturas de supercomputación.

HPE Cray Supercomputing GX250 Compute Blade

Blade orientado a particiones de solo CPU para cargas de doble precisión clásicas de HPC:

  • 8 CPUs AMD EPYC “Venice” por blade
  • Hasta 40 blades por rack, lo que proporciona una densidad de núcleos x86 de primer nivel

La idea es permitir configuraciones híbridas: una partición GPU (con blades GX440n o GX350a) y una partición CPU pura basada en GX250, en el mismo sistema, según las necesidades del centro.

Todos los blades comparten elementos clave:

  • Refrigeración directa por líquido al 100 %, pensada para la alta densidad y el consumo creciente de las GPUs de nueva generación.
  • Hasta 4 u 8 endpoints HPE Slingshot 400 Gbps por blade, para integrarse en redes de baja latencia a gran escala.
  • Opción de añadir unidades NVMe por blade, para cachear datos críticos o acelerar flujos de E/S cercanos al cómputo.

Gestión unificada y multitenant para infraestructuras de IA y HPC

Uno de los retos de los grandes sistemas es gestionarlos de forma segura y eficiente. HPE introduce HPE Supercomputing Management Software, una capa de software que centraliza:

  • Provisionamiento, monitorización y escalado de la infraestructura.
  • Gestión de potencia y energía, con métricas que ayudan a estimar consumo y a integrarse con planificadores “power-aware”.
  • Soporte para entornos multi-tenant, virtualizados y contenerizados, permitiendo aislar usuarios y grupos de trabajo.
  • Funciones reforzadas de seguridad y gobernanza, pensadas para entornos donde la confidencialidad de datos y modelos es crítica.

La intención es que los grandes centros de supercomputación puedan operar sus sistemas como una plataforma compartida para IA y HPC, sin necesidad de mantener silos separados para cada tipo de carga.


HPE Slingshot 400: interconexión preparada para la era exa-IA

El componente de red es otro pilar de la propuesta. HPE Slingshot 400, ya anunciado anteriormente, se adapta ahora al formato del GX5000:

  • Nuevo chasis para switch blade refrigerado por líquido, con 64 puertos de 400 Gbps por conmutador.
  • Configuraciones posibles:
    • 8 switches con 512 puertos
    • 16 switches con 1.024 puertos
    • 32 switches con 2.048 puertos

Slingshot 400 busca ofrecer:

  • Menor latencia y mayor ancho de banda sostenido
  • Gestión de congestión y fiabilidad pensadas para patrones de tráfico propios de IA a gran escala y simulación paralela
  • Aprovechamiento completo de la topología de alto rendimiento del GX5000, manteniendo los costes bajo control frente a diseños más personalizados.

K3000: almacenamiento DAOS pensado para IA intensiva en datos

La otra gran pieza es el sistema de almacenamiento HPE Cray Supercomputing Storage Systems K3000, basado en servidores HPE ProLiant Compute DL360 Gen12 e integrado de fábrica con el software Distributed Asynchronous Object Storage (DAOS).

El objetivo es responder a aplicaciones donde la E/S es el cuello de botella, especialmente:

  • Entrenamiento y fine-tuning de grandes modelos de IA.
  • Workloads de análisis de datos masivos con patrones de acceso complejos.
  • Simulaciones científicas que generan volúmenes enormes de resultados.

Entre las opciones de configuración destacan:

  • Servidores optimizados para rendimiento con 8, 12 o 16 unidades NVMe.
  • Servidores optimizados para capacidad con 20 unidades NVMe.
  • Capacidades por unidad de 3,84 TB, 7,68 TB o 15,36 TB.
  • Configuraciones de memoria DRAM de 512 GB, 1.024 GB o 2.048 GB, en función del tamaño de los discos.

En conectividad, el K3000 admite:

  • HPE Slingshot 200 y 400
  • InfiniBand NDR
  • Ethernet a 400 Gbps

La combinación de DAOS con NVMe y estas interconexiones está pensada para ofrecer baja latencia y alto rendimiento sostenido, algo clave para que la parte de almacenamiento no limite la productividad de los clusters de IA.


Alemania, terreno de prueba: Herder y Blue Lion

La apuesta de HPE no se queda en papel: dos de los grandes centros de supercomputación académicos de Alemania han elegido el HPE Cray GX5000 como base de sus próximos sistemas insignia:

  • El High-Performance Computing Center de la Universidad de Stuttgart (HLRS), que desplegará el supercomputador Herder.
  • El Leibniz Supercomputing Centre (LRZ) de la Academia Bávara de Ciencias y Humanidades, con su futuro sistema Blue Lion.

En ambos casos, los responsables han subrayado dos factores clave:

  1. Salto de rendimiento: en el caso de LRZ, se habla de una mejora sostenida de hasta 30 veces respecto al sistema actual, permitiendo combinar simulación clásica con técnicas avanzadas de IA.
  2. Eficiencia energética y sostenibilidad: Blue Lion utilizará refrigeración líquida directa capaz de operar con temperaturas de hasta 40 °C, lo que facilita la reutilización del calor residual en el campus de investigación de Garching.

HPE refuerza así su posición en el ecosistema europeo de HPC e IA, en un momento en el que la soberanía tecnológica y la eficiencia energética se han convertido en prioridades estratégicas.


Calendario y contexto de mercado

HPE ha fijado un calendario escalonado:

  • Los blades GX440n, GX350a y GX250, así como el HPE Supercomputing Management Software y el HPE Slingshot 400 para GX5000, estarán disponibles a partir de principios de 2027.
  • El sistema de almacenamiento K3000 con servidores ProLiant llegará antes: principios de 2026.

Mientras tanto, el sector vive una fase de fuerte crecimiento tanto en HPC como en IA generativa, con una demanda creciente de infraestructura capaz de escalar sin disparar costes ni consumo energético. La jugada de HPE con su nueva generación Cray busca precisamente eso: ofrecer una arquitectura preparada para los próximos años, en los que la línea entre supercomputador científico y “fábrica” de modelos de IA será cada vez más borrosa.

Para centros de datos, universidades y grandes empresas que se plantean nuevas inversiones, el mensaje es claro: la próxima oleada de supercomputación no se medirá solo en petaflops o exaflops, sino en flops por vatio, en flexibilidad para mezclar IA y HPC y en la capacidad de gestionar infraestructuras complejas como si fueran una única plataforma. Y el nuevo portfolio HPE Cray Supercomputing quiere ser uno de los candidatos de referencia en ese terreno.

vía: hpe

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO

×