En la conferencia Hot Chips 2024, celebrada en Palo Alto, California, IBM ha revelado su nuevo chip acelerador Spyre, diseñado para potenciar la capacidad de inteligencia artificial (IA) en sus sistemas IBM Z. Esta innovadora tecnología, desarrollada en colaboración con IBM Research, promete revolucionar el procesamiento de cargas de trabajo de IA en entornos empresariales al ofrecer un rendimiento sin precedentes.
Un Salto Cuantitativo en la Arquitectura de IA
El Spyre es la evolución del chip IA que IBM presentó en 2022 con el IBM z16, que incorporaba el microprocesador Telum, un acelerador de IA integrado para inferencias en tiempo real. El nuevo chip Spyre lleva esta tecnología al siguiente nivel al incorporar 32 núcleos de aceleración y una arquitectura avanzada con 25.6 mil millones de transistores.
El Spyre utiliza tecnología de proceso de 5 nm y está montado en una tarjeta PCIe. Este diseño permite la agrupación de tarjetas, lo que significa que una sola máquina IBM Z puede equiparse con clusters de tarjetas Spyre para agregar hasta 256 núcleos de aceleración adicionales.
Optimización y Escalabilidad para Empresas
Con aproximadamente el 70% de las transacciones mundiales en valor gestionadas por mainframes de IBM, el Spyre tiene el potencial de llevar la IA generativa a estos sistemas críticos para la misión. Este chip está diseñado para ayudar a las empresas a escalar sus capacidades de IA según sea necesario, permitiendo el despliegue de modelos y programas de IA con mayor potencia y eficiencia.
El Spyre no solo mejora el rendimiento en comparación con CPUs estándar, sino que también utiliza un diseño de chip optimizado para tareas de IA. A diferencia de las arquitecturas tradicionales, que transfieren constantemente datos entre la unidad de procesamiento y la memoria, el Spyre permite que los datos se transfieran directamente entre motores de cálculo, lo que resulta en un ahorro de energía y una mayor eficiencia.
Aplicaciones y Posibilidades Futuras
El Spyre abrirá nuevas oportunidades para el uso de IA en los sistemas IBM Z. Más allá de la detección de fraude en transacciones, un sistema equipado con un cluster de Spyre podría utilizar modelos de IA más complejos para identificar patrones de fraude intricados que modelos menos avanzados podrían pasar por alto.
Además, el Spyre permitirá una integración más profunda con productos como Watsonx, la plataforma de IA y datos de IBM. Por ejemplo, permitirá ejecutar el Watsonx Code Assistant para modernizar bases de código en mainframes con una eficacia mucho mayor, facilitando la comprensión y actualización del código de aplicaciones.
Un Futuro Prometedor para la IA en Mainframes
Este desarrollo marca solo el comienzo de lo que IBM Research prevé para la IA en IBM Z. El equipo de investigación está trabajando para superar los límites actuales de la inferencia y explorar formas efectivas de afinamiento e incluso entrenamiento de modelos directamente en los mainframes. La visión es permitir a las organizaciones entrenar y desplegar modelos en plataformas como Watsonx dentro de sus instalaciones, manteniendo todos los datos de forma segura y en su lugar.
Con el Spyre, IBM está abriendo un nuevo capítulo en el procesamiento de IA para empresas, ofreciendo soluciones de alta potencia para afrontar desafíos complejos y asegurar que las capacidades de IA estén al alcance de las organizaciones que requieren máxima seguridad y rendimiento.
Fuente: IBM