China planta cara en la carrera por la inteligencia artificial a través de una impresionante arquitectura de sistema basada en sus propios chips Ascend 910C.
En plena escasez global de GPU y con EE.UU. liderando el desarrollo de modelos de inteligencia artificial gracias a los sistemas de NVIDIA, China ha contraatacado con una propuesta inesperadamente contundente. Huawei ha presentado el AI CloudMatrix 384, una arquitectura de supercomputación para IA que, aunque parte de chips individuales menos potentes, supera a los sistemas estadounidenses al escalar su infraestructura de forma masiva y eficiente.
Más GPU, más rendimiento… aunque a mayor coste energético
El CloudMatrix 384 se basa en la conexión de 384 GPU Ascend 910C mediante una topología all-to-all, lo que permite una comunicación directa y paralela entre cada uno de los aceleradores. Aunque estos chips ofrecen solo una fracción del rendimiento por unidad respecto a las GB200 de NVIDIA (usadas en el sistema NVL72), el diseño de Huawei logra superar a su rival en el rendimiento global del sistema:
- 300 PFLOPS de rendimiento en precisión BF16 (frente a 180 PFLOPS del NVL72).
- 3,6 veces más memoria HBM disponible.
- 2,1 veces más ancho de banda de memoria.
El sistema se distribuye en 16 racks, 12 de ellos con GPUs y 4 racks intermedios dedicados a conmutadores escalables de red conectados por más de 6.900 transceptores ópticos 400G. Esta escala masiva recuerda a la plataforma NVL256 “Ranger” de NVIDIA, que fue finalmente descartada por su elevado coste y consumo.
Huawei gana en escala, pero pierde en eficiencia
En términos de eficiencia energética, NVIDIA mantiene la ventaja:
- 2,3 veces más potencia por FLOP que Huawei.
- Menor consumo por TB/s de ancho de banda y por TB de memoria HBM.
Sin embargo, este punto es menos crítico en el caso de China, donde no existen restricciones significativas de consumo eléctrico en centros de datos para IA, a diferencia de EE.UU. o Europa. De hecho, el país asiático ha añadido en la última década una capacidad energética equivalente a toda la red eléctrica estadounidense, en parte gracias a inversiones masivas en fuentes como la nuclear y el carbón.
Dependencia tecnológica y límites de producción
Aunque el diseño del chip Ascend 910C es completamente chino, su fabricación sigue dependiendo de actores internacionales. La mayoría de unidades hasta ahora se han producido con litografía de 7 nm de TSMC, y Huawei ha logrado sortear algunas sanciones mediante terceros como Sophgo. A esto se suma el acceso continuo a memorias HBM de Samsung, que incluso tras los controles de exportación, han seguido llegando a través de integraciones con chips lógicos de bajo rendimiento.
No obstante, China está avanzando en su capacidad de fabricación doméstica, con fábricas como SMIC y CXMT expandiendo sus operaciones. Si se consigue escalar esta producción localmente, Huawei podría multiplicar su número de chips disponibles para alimentar futuros sistemas CloudMatrix.
IA sin límites: más escala y menos barreras
El enfoque de Huawei es claro: si no puedes competir en chip por chip, hazlo en sistema por sistema. El CloudMatrix 384 es una respuesta estratégica que demuestra cómo la inteligencia artificial no solo se gana con la arquitectura más avanzada, sino también con la capacidad de integrar, escalar y sostener operaciones a gran escala sin restricciones energéticas ni regulatorias.
En resumen, Huawei ha encontrado una vía para competir con los gigantes estadounidenses en IA, no desde la eficiencia individual, sino desde la potencia bruta colectiva. Aunque el coste energético sea alto, el sistema es funcional y puede alimentar los ambiciosos planes de China en inteligencia artificial, reafirmando su determinación de no quedarse atrás en esta nueva carrera tecnológica global.
Vía: Semianalysis