Intel y Aible, una solución empresarial integral de inteligencia artificial generativa (GenAI) y análisis aumentados sin servidor, han anunciado nuevas soluciones para clientes compartidos que permiten ejecutar casos de uso avanzados de GenAI y generación aumentada por recuperación (RAG) en múltiples generaciones de CPUs Intel® Xeon®. Esta colaboración, que incluye optimizaciones de ingeniería y un programa de benchmarking, mejora la capacidad de Aible para ofrecer resultados de GenAI a bajo costo para clientes empresariales y ayuda a los desarrolladores a integrar inteligencia artificial en sus aplicaciones.
Innovaciones en el Rendimiento de GenAI con Intel Xeon
Las soluciones de Aible demuestran cómo las CPUs pueden mejorar significativamente el rendimiento en una variedad de cargas de trabajo de IA modernas, desde la ejecución de modelos de lenguaje hasta RAG. Optimizadas para procesadores Intel, la tecnología de Aible utiliza un enfoque eficiente sin servidor para IA, consumiendo recursos solo cuando hay solicitudes activas de los usuarios. Por ejemplo, la base de datos vectorial se activa solo por unos segundos para recuperar información relevante para una consulta del usuario, y el modelo de lenguaje se enciende brevemente para procesar y responder a la solicitud. Esta operación bajo demanda ayuda a reducir el costo total de propiedad (TCO).
Aunque RAG generalmente se implementa utilizando GPUs (unidades de procesamiento gráfico) y aceleradores para aprovechar sus capacidades de procesamiento en paralelo, la técnica sin servidor de Aible, combinada con los procesadores escalables Intel® Xeon®, permite que los casos de uso de RAG sean impulsados completamente por CPUs. Los datos de rendimiento muestran que múltiples generaciones de procesadores Intel Xeon pueden ejecutar cargas de trabajo de RAG de manera eficiente.
Colaboración Estratégica para la Eficiencia en la IA
Mishali Naik, ingeniera principal senior de Intel en el Grupo de Centros de Datos e IA, destacó: «Los clientes buscan soluciones eficientes y de nivel empresarial para aprovechar el poder de la IA. Nuestra colaboración con Aible muestra cómo estamos trabajando estrechamente con la industria para ofrecer innovación en IA y reducir la barrera de entrada para que muchos clientes ejecuten las últimas cargas de trabajo de GenAI utilizando procesadores Intel Xeon».
Reducción de Costes y Mejora de la Eficiencia
Aible permite a los clientes reducir los costes operativos de los proyectos de GenAI al utilizar exclusivamente CPUs en forma sin servidor para compartir de manera más segura los mismos recursos informáticos subyacentes entre múltiples clientes. Según el análisis de benchmarks de Aible, los clientes pueden lograr hasta un ahorro de costos de 55 veces al ejecutar modelos RAG en sus soluciones sin servidor basadas en CPUs. Esta reducción de costos es un testimonio de la efectividad del enfoque exclusivo de Aible, que evita la necesidad de infraestructuras basadas en GPU más costosas.
Resultados de la Colaboración Intel-Aible
Intel, incluyendo Intel Labs, ha trabajado con Aible para optimizar las cargas de trabajo de IA en procesadores Xeon. Notablemente, al optimizar el código de Aible para AVX-512, Aible vio ganancias significativas en el rendimiento y mejoró su capacidad en procesadores Xeon, destacando el impacto de las optimizaciones estratégicas de software en la eficiencia general.
La combinación de modelos RAG con procesadores Intel Xeon, facilitada por plataformas como Aible, puede habilitar aplicaciones como:
- Procesamiento de lenguaje natural (NLP)
- Sistemas de recomendación
- Sistemas de soporte de decisiones
- Generación de contenido