De consumir tokens a producirlos: el nuevo reto económico de la IA empresarial
La irrupción de los modelos de razonamiento avanzado y los agentes de inteligencia artificial está transformando profundamente la forma en que las empresas planifican y presupuestan sus estrategias tecnológicas. El consumo de tokens —la unidad de medida sobre la que se factura el uso de los grandes modelos de lenguaje— se está disparando: los nuevos modelos de razonamiento consumen entre 10 y 20 veces más tokens que los modelos estándar solo para procesar un problema, una cifra que se multiplica de forma exponencial a medida que los agentes de IA encadenan tareas y utilizan herramientas de forma autónoma.
Ante este escenario, las organizaciones se enfrentan a un cambio de paradigma: ya no basta con consumir tokens de forma eficiente, sino que el éxito pasa por controlar la infraestructura de inferencia, enrutar las consultas al punto de acceso más rentable y, en muchos casos, ejecutar modelos propios alojados internamente y optimizados para las necesidades específicas del negocio.
El camino del ‘Metal to Agents’
Así lo plantea Red Hat, que define este recorrido como un camino de «Metal to Agents»: un stack abierto e integrado de extremo a extremo en el que cada capa —desde los aceleradores físicos de IA hasta los propios agentes— esté conectada y diseñada con la seguridad como prioridad. Esta infraestructura debe ser compatible con un ecosistema diverso de hardware, incluyendo procesadores de NVIDIA, AMD, Intel y el silicio personalizado de los principales proveedores cloud.
En el centro de este sistema se sitúa la inferencia, el factor clave para escalar cualquier estrategia de IA. Red Hat asegura que su trabajo en proyectos como vLLM y en inferencia distribuida con llm-d ha permitido reducir en diez veces el tiempo hasta obtener el primer token y triplicar la calidad de las respuestas en aplicaciones reales.
Los agentes, núcleo de la estrategia empresarial
Más allá de la infraestructura, el foco se desplaza ahora hacia los servicios para agentes. Los agentes de IA han dejado de ser proyectos experimentales para convertirse en el núcleo de la estrategia empresarial moderna, aunque plantean nuevos desafíos de gobernanza: distintos equipos utilizan herramientas diferentes, lo que exige dotar a cada agente de una identidad verificada, gestionar su ciclo de vida con control de versiones y apoyarse en estándares emergentes como MCP Services para conectar agentes con herramientas y datos sin generar brechas de seguridad.
Casos reales: BNP Paribas y la NASA
Algunas organizaciones ya están recorriendo este camino con resultados concretos. BNP Paribas ha generado casi 600 millones de dólares de valor al industrializar mil casos de uso de IA sobre una plataforma unificada, convirtiendo el aprovisionamiento de GPU —antes un proceso que tardaba semanas— en un servicio que se presta en minutos. Por su parte, el Marshall Space Flight Center de la NASA ha adoptado plataformas similares para trasladar miles de cargas de trabajo heredadas a entornos contenerizados, reduciendo los tiempos de despliegue de días a minutos en operaciones de carácter crítico.
Estos ejemplos ilustran una tendencia más amplia: las estrategias de IA dejan de centrarse exclusivamente en la eficiencia y el ahorro de costes para convertirse en motores de crecimiento e ingresos. El objetivo final, según este enfoque, es que las empresas sean dueñas de la plataforma que sostiene sus operaciones más críticas, combinando el acceso a modelos de vanguardia con el control y la gobernanza que exige cualquier equipo de TI responsable.