China vuelve a poner el listón del supercómputo en lo alto. Un equipo de investigación ha demostrado en el nuevo superordenador Sunway “OceanLite” que las redes neuronales de estados cuánticos (NNQS) pueden escalar hasta tamaños moleculares relevantes, con una eficiencia casi perfecta y sobre decenas de millones de núcleos. El avance no es solo una proeza de rendimiento: sugiere una vía pragmática para modelar materiales y reacciones químicas con la computación clásica más potente disponible hoy, sin esperar a procesadores cuánticos útiles.
Qué han hecho exactamente
El trabajo lleva a exaescala un enfoque ya conocido en la literatura —NNQS—, que entrena una red para aproximar la función de onda de un sistema electrónico y así predecir propiedades y energías. Ese entrenamiento exige dos pasos muy costosos: muestrear configuraciones (como “fotos” del sistema cuántico) y calcular para cada una la energía local. A medida que crece la molécula, ambos pasos se desequilibran y el cálculo se vuelve irregular; escalarlo de forma eficiente es la parte difícil.
En Sunway, los autores han desplegado un NNQS-Transformer adaptado a la arquitectura del sistema: núcleos ligeros que calculan dentro de memoria local y núcleos de gestión que coordinan comunicaciones, con un equilibrio de carga diseñado para que todos los núcleos trabajen todo el tiempo. El resultado: el código corrió en ~37 millones de núcleos con 92 % de escalado fuerte y 98 % de escalado débil, es decir, casi sin pérdidas ni al añadir recursos a un mismo problema ni al crecer el problema junto con los recursos. En química cuántica, esa clase de eficiencias a esta escala son poco comunes.
Por qué importa
Hasta ahora, las NNQS se quedaban a menudo en sistemas pequeños. En esta demostración se han alcanzado estructuras de hasta 120 orbitales de espín, una cifra que empieza a acercar el método a moléculas y materiales con interés práctico. Si estos algoritmos mantienen el tipo a gran escala, los superordenadores de exaescala podrían acelerar el descubrimiento de nuevos compuestos, catalizadores o fármacos mucho antes de que existan ordenadores cuánticos maduros para estas tareas.
Además, el experimento refuerza una lectura de fondo: las arquitecturas que hoy entrenan los LLM también pueden aprender la estructura de la materia. Que un sistema pensado para cargas regulares (entrenamiento profundo) haya resuelto una carga irregular (química cuántica) con estas eficiencias habla de madurez de software, de particionado de datos y de un trabajo fino en comunicación e I/O.
El perfil de la máquina: Sunway por dentro
Sunway “OceanLite” es el sucesor de TaihuLight y emplea chips SW26010-Pro, organizados en clústeres de núcleos con memoria cercana (“scratchpad”) en lugar de una jerarquía de cachés convencional. Decenas de miles de estos chips se interconectan en un sistema de más de 40 millones de núcleos que ha demostrado rendimiento de exaescala en distintos retos científicos. La localidad de datos y el control fino de la memoria encajan bien con el enfoque NNQS-Transformer cuando se diseña para esa topología.
Un detalle llamativo es el uso de Julia en el stack de software: un lenguaje de alto nivel que, combinado con código específico muy optimizado, permite prototipar rápido sin renunciar a rendimiento cercano a C/Fortran. Hace unos años esto sonaba a experimento; hoy es una pieza más en un entorno de HPC productivo.
Dónde están los límites (ahora mismo)
Escalar la matemática era el primer muro; el segundo será mover y gestionar los datos. Estas simulaciones generan volúmenes gigantescos y exigen que millones de núcleos compartan información de forma constante. El cuello de botella se desplaza a almacenamiento y red, que deberán entregar datos casi tan rápido como se computan. El propio equipo apunta a esta frontera: sin I/O a la altura, la eficiencia teórica se quedará en el papel.
También falta ampliar el catálogo de sistemas: más allá de los 120 orbitales de espín, habrá que probar con geometrías complejas, estados excitados y entornos (solventes, superficies). El objetivo no es solo la escala, sino la exactitud química frente a métodos de referencia (por ejemplo, acoplado de cúmulos) en regímenes de fuerte correlación.
Qué significa para la carrera IA-ciencia
El mensaje al ecosistema es doble. Para la química y los materiales, la IA no sustituye a la física cuántica: la aproxima con una relación precisión/coste cada vez más atractiva en supercomputadores modernos. Para el HPC, demuestra que el camino de la exaescala no solo sirve para ganar benchmarks, sino para abrir ciencia nueva cuando se alinean algoritmo, arquitectura y software.
A medio plazo, cabe esperar colaboraciones cruzadas: grupos de química aportando conjuntos de validación y métricas; equipos de HPC afinando comunicación, programación heterogénea y almacenamiento; y proveedores de memoria/red ofreciendo topologías más listas para NNQS. Si el triángulo se cierra, materiales y fármacos podrían beneficiarse antes de lo previsto.
Contexto y precedentes
La idea de usar redes neuronales para funciones de onda no es nueva, pero su salto de escala sí lo es. La comunidad ya había presentado variantes Transformer para NNQS con buenas métricas y escalabilidad en problemas medianos; igualmente, el propio equipo Sunway había mostrado simulaciones cuánticas masivas (p. ej., circuitos aleatorios) con eficiencia cercana al ideal. Lo diferencial ahora es juntar ambas cosas —NNQS + Sunway— y demostrar regularidad donde antes había irregularidad y cuellos.
Lo que viene
- Más química real: validaciones con conjuntos amplios y comparativas directas frente a métodos ab initio estándar.
- I/O de nueva generación: redes más inteligentes y almacenamiento más rápido para que el cómputo no espere a los datos.
- Portabilidad: reproducir estos resultados en otras arquitecturas exaescala (EE. UU., UE, Japón) para consolidar el enfoque como herramienta de trabajo, no solo como hito.
via: vastdata y IEEE Explore