En Computex 2024, AMD ha destacado el creciente impulso de su línea de aceleradores AMD Instinct™ durante el discurso inaugural de la presidenta y CEO, Dra. Lisa Su. AMD ha revelado una hoja de ruta ampliada y plurianual para los aceleradores AMD Instinct, prometiendo un liderazgo anual en rendimiento de IA y capacidades de memoria con cada nueva generación.
La hoja de ruta actualizada comienza con el nuevo acelerador AMD Instinct MI325X, disponible en el cuarto trimestre de 2024. Posteriormente, se lanzará la serie AMD Instinct MI350 en 2025, equipada con la nueva arquitectura AMD CDNA™ 4, que ofrecerá un aumento de hasta 35 veces en el rendimiento de inferencia de IA en comparación con la serie AMD Instinct MI300 basada en la arquitectura AMD CDNA 3. Para 2026, se espera la serie AMD Instinct MI400, que se fundamentará en la arquitectura AMD CDNA «Next».
“Los aceleradores AMD Instinct MI300X continúan su fuerte adopción por parte de numerosos socios y clientes, incluyendo Microsoft Azure, Meta, Dell Technologies, HPE, Lenovo y otros, un resultado directo del excepcional rendimiento y propuesta de valor del acelerador AMD Instinct MI300X”, dice Brad McCredie, vicepresidente corporativo de Computación Acelerada para Centros de Datos de AMD. “Con nuestra cadencia anual actualizada de productos, somos implacables en nuestro ritmo de innovación, proporcionando las capacidades de liderazgo y el rendimiento que la industria de la IA y nuestros clientes esperan para impulsar la próxima evolución del entrenamiento y la inferencia de IA en el centro de datos”.
El ecosistema de software de IA de AMD madura
La pila de software abierto AMD ROCm™ 6 continúa madurando, lo que permite a los aceleradores AMD Instinct MI300X impulsar un rendimiento impresionante para algunos de los LLM más populares. En un servidor que utiliza ocho aceleradores AMD Instinct MI300X y ROCm 6 ejecutando Meta Llama-3 70B, los clientes pueden obtener un rendimiento de inferencia y generación de tokens 1,3 veces mejor en comparación con la competencia. En un único acelerador AMD Instinct MI300X con ROCm 6, los clientes pueden obtener un rendimiento de inferencia y generación de tokens 1,2 veces superior al de la competencia en Mistral-7B. AMD también ha destacado que Hugging Face, el mayor y más popular repositorio de modelos de IA, está probando 700.000 de sus modelos más populares cada noche para garantizar que funcionan de forma inmediata en los aceleradores AMD Instinct MI300X. Además, AMD sigue trabajando en marcos de trabajo de IA populares como PyTorch, TensorFlow y JAX.
AMD avanza nuevos aceleradores y revela la hoja de ruta anual de Cadence
Durante la keynote, AMD ha revelado una cadencia anual actualizada para la hoja de ruta del acelerador AMD Instinct para satisfacer la creciente demanda de más computación de IA. Esto ayudará a garantizar que los aceleradores AMD Instinct impulsen el desarrollo de modelos de IA de vanguardia de próxima generación. La hoja de ruta anual actualizada de AMD Instinct destaca:
- El nuevo acelerador AMD Instinct MI325X, que aportará 288 GB de memoria HBM3E y 6 terabytes por segundo de ancho de banda de memoria, utilizará el mismo diseño de servidor de placa base universal estándar del sector utilizado por la serie AMD Instinct MI300, y estará disponible de forma general en el cuarto trimestre de 2024. El acelerador tendrá una capacidad de memoria y un ancho de banda líderes en el sector, 2 veces y 1,3 veces mejores que los de la competencia, respectivamente, y un rendimiento de cálculo 1,3 veces superior al de la competencia.
- El primer producto de la serie AMD Instinct MI350, el acelerador AMD Instinct MI350X, se basa en la arquitectura AMD CDNA 4 y se espera que esté disponible en 2025. Utilizará el mismo diseño de servidor de placa base universal estándar del sector que otros aceleradores de la serie MI300 y se fabricará con la avanzada tecnología de proceso de 3 nm, será compatible con los tipos de datos de IA FP4 y FP6 y tendrá hasta 288 GB de memoria HBM3E.
- Se espera que la arquitectura AMD CDNA «Next», que impulsará los aceleradores AMD Instinct MI400 Series, esté disponible en 2026, proporcionando las últimas características y capacidades que ayudarán a desbloquear un rendimiento y eficiencia adicionales para la inferencia y el entrenamiento de IA a gran escala.
Por último, AMD destacó que la demanda de aceleradores AMD Instinct MI300X sigue creciendo con numerosos socios y clientes que utilizan los aceleradores para potenciar sus exigentes cargas de trabajo de IA, incluyendo:
- Microsoft Azure utilizando los aceleradores para servicios Azure OpenAI y las nuevas máquinas virtuales Azure ND MI300X V5.
- Dell Technologies utiliza aceleradores MI300X en el PowerEdge XE9680 para cargas de trabajo de IA empresariales.
- Supermicro ofrece múltiples soluciones con aceleradores AMD Instinct.
- Lenovo potencia la innovación de IA híbrida con el ThinkSystem SR685a V3.
HPE los utiliza para acelerar las cargas de trabajo de IA en el HPE Cray XD675.