La primera etapa de la inteligencia artificial generativa en la empresa se vendió como una promesa de productividad casi inevitable. Más código, más documentos, más automatización y menos tiempo perdido en tareas repetitivas. La segunda etapa está siendo bastante menos épica: revisar facturas, poner límites de gasto y explicar al área financiera por qué una herramienta que parecía una licencia SaaS más se comporta como una infraestructura de consumo variable.
El problema no es que la IA no funcione. Esa sería una lectura demasiado simple. El problema es que, cuando funciona, se usa mucho más de lo previsto. Y cuando se usa mucho, deja al descubierto una verdad que el mercado ha intentado aplazar durante dos años: ejecutar modelos avanzados a escala cuesta mucho dinero. No basta con pagar una cuota por usuario si debajo hay sesiones largas, agentes que recorren repositorios enteros, contextos enormes, respuestas extensas y varios modelos trabajando en cadena.
La tarifa plana fue una fase de adquisición de mercado
Durante la fase inicial, muchas herramientas de IA se financiaron con una lógica parecida a la de otros mercados tecnológicos: crecer rápido, ganar usuarios, crear hábito y asumir que los costes bajarían con el tiempo. Esa estrategia tiene sentido cuando el coste marginal es bajo o tiende a cero. En IA generativa, el coste marginal no desaparece. Cada interacción consume inferencia, energía, memoria, red y capacidad de GPU. Cada agente que trabaja en segundo plano transforma esa promesa de software barato en una carga operativa real.
GitHub ha puesto nombre al cambio. A partir del 1 de junio de 2026, Copilot empezará a consumir GitHub AI Credits en todos sus planes. La compañía mantiene los precios base, pero el uso se calculará con tokens de entrada, salida y caché, según el modelo utilizado. La explicación oficial es clara: Copilot ya no es solo un asistente dentro del editor, sino una plataforma agentic capaz de ejecutar sesiones largas y de varios pasos sobre repositorios completos. Ese uso genera mucha más demanda de cómputo e inferencia que una pregunta rápida en un chat.
La documentación para empresas refuerza el mensaje. GitHub define los AI Credits como unidad de facturación, con 1 crédito equivalente a 0,01 dólares, y permite controlar presupuestos por organización, empresa, centro de coste o usuario. También deja claro que una sesión larga de un agente de programación con un modelo de frontera cuesta más porque está haciendo más trabajo.
La lectura empresarial es evidente: el coste de la IA deja de esconderse dentro de una licencia y pasa a parecerse más al cloud. Nadie sensato desplegaría infraestructura sin presupuestos, límites, observabilidad y alertas. Sin embargo, muchas empresas han desplegado IA como si fuera una herramienta ofimática más. Esa etapa se está terminando.
Microsoft, Uber y el despertar financiero de la IA
El caso de Microsoft es especialmente simbólico. The Verge publicó que la compañía planea retirar la mayoría de las licencias internas de Claude Code en su área Experiences + Devices y mover a muchos desarrolladores hacia GitHub Copilot CLI. Microsoft comunicó internamente que la decisión busca converger en Copilot CLI como interfaz agentic principal, aunque las fuentes citadas por el medio apuntan también a una razón financiera y al cierre de su ejercicio fiscal.
Conviene no simplificarlo. Microsoft no está diciendo que Claude no sirva. De hecho, la misma información señala que los modelos de Anthropic seguirán disponibles a través de Copilot CLI y que Microsoft continúa usando Claude en distintos productos. Lo relevante es otro asunto: incluso una gran tecnológica con una posición privilegiada en cloud, modelos e infraestructura está racionalizando el acceso interno a herramientas de IA cuando el uso empieza a pesar en la cuenta de resultados.
Uber ofrece otra señal de la misma tendencia. AI Magazine recogió que la compañía habría agotado su presupuesto de IA para 2026 en apenas cuatro meses, en buena medida por el uso intensivo de herramientas de programación asistida. Aunque el dato procede de informaciones secundarias y debe leerse con cautela, encaja con un patrón que muchas empresas ya están viendo: la adopción real puede consumir mucho más que los pilotos que justificaron la compra inicial.
Anthropic también ha tenido que ajustar sus propias estimaciones públicas sobre Claude Code. Business Insider informó de que la compañía elevó de 6 a 13 dólares el coste medio estimado por desarrollador y día activo en despliegues enterprise, con un rango mensual de 150 a 250 dólares por desarrollador. Anthropic explicó que no se trataba de una subida de precio, sino de una actualización ligada al uso de modelos más avanzados y a patrones de consumo diferentes.
Esta distinción importa. El precio oficial puede no cambiar, pero el coste efectivo sí. Si una herramienta se vuelve mejor, los empleados la usan más. Si los agentes son capaces de resolver tareas más largas, consumen más contexto. Si un equipo automatiza revisiones, pruebas, documentación y análisis de incidencias, la factura crece aunque cada token sea más barato que hace un año.
| Señal del mercado | Lo que realmente indica | Consecuencia para empresas |
|---|---|---|
| Copilot pasa a AI Credits | La tarifa plana pura no cubre el uso agentic intensivo | Necesidad de presupuestos y límites por equipo |
| Microsoft reduce licencias internas de Claude Code | La elección de herramienta también es una decisión financiera | Más presión para consolidar proveedores |
| Claude Code eleva estimaciones de coste | Los modelos más capaces cambian el patrón de consumo | El piloto ya no sirve para prever gasto anual |
| Uber habría agotado su presupuesto de IA | La adopción masiva puede superar cualquier previsión inicial | FinOps para IA deja de ser opcional |
| Agentes de código con facturas millonarias | La automatización continua dispara el consumo | Hace falta decidir qué tareas merecen modelos frontera |
La productividad no basta si no se mide el coste
La defensa habitual de estas herramientas es que, si aumentan la productividad, el coste está justificado. Puede ser cierto. Pero esa frase ya no basta. Una empresa necesita saber qué productividad obtiene, en qué equipos, con qué modelos y a qué coste. Sin esa medición, la IA se convierte en una partida presupuestaria expansiva que crece por entusiasmo, no por retorno.
El ejemplo extremo de OpenClaw ayuda a entender el problema, aunque no sea representativo de una empresa media. Tom’s Hardware publicó que Peter Steinberger mostró un consumo de más de 1,3 millones de dólares en tokens de OpenAI durante 30 días, con 603.000 millones de tokens y 7,6 millones de peticiones generadas por unas 100 instancias de Codex. El coste lo cubría OpenAI y el propio caso se presenta como un laboratorio de desarrollo asistido sin restricciones presupuestarias, pero la cifra sirve para visualizar qué ocurre cuando se eliminan los frenos.
En el otro extremo está Salesforce. Marc Benioff afirmó que la compañía probablemente gastará 300 millones de dólares en tokens de Anthropic durante el año, al mismo tiempo que defendió la productividad obtenida con agentes de programación y pidió una capa intermedia capaz de decidir qué peticiones deben ir a modelos de frontera y cuáles pueden resolverse con modelos más pequeños.
Esa capa intermedia será una de las piezas más importantes de la próxima etapa. Las empresas no pueden enviar todo a los modelos más potentes. Tampoco pueden degradar todos los casos de uso a modelos pequeños si necesitan calidad, razonamiento o fiabilidad. Hará falta enrutamiento inteligente de modelos, caché, límites por tarea, evaluación de calidad, monitorización de consumo y políticas claras sobre cuándo merece la pena pagar por un modelo caro.
La IA no sustituye al cloud: lo convierte en una disciplina financiera
La gran lección de esta fase es que la IA empresarial se parece menos al software tradicional y más a una infraestructura crítica. Tiene costes variables, dependencia de capacidad externa, riesgo de exceso de consumo, diferencias entre proveedores, problemas de latencia, requisitos de seguridad y decisiones de arquitectura. Por eso el debate se desplazará hacia FinOps de IA, cloud híbrido, modelos open source, inferencia propia y gobierno del dato.
No todas las empresas necesitan montar su propia infraestructura de IA. Para muchas, consumir APIs seguirá siendo lo más razonable. Pero las cargas estables, repetitivas, sensibles o de alto volumen empezarán a analizarse con otros ojos. Si un flujo consume millones de tokens cada día, la pregunta de si debe ejecutarse siempre en un proveedor externo dejará de ser teórica.
La etapa de “probar todo porque la IA es barata” está dando paso a otra más adulta: usar IA donde tenga sentido, medir el retorno y diseñar arquitecturas que no conviertan cada mejora de productividad en una factura imprevisible. Los proveedores intentarán defender márgenes. Los clientes intentarán controlar costes. Entre ambos habrá una negociación dura sobre precios, límites, modelos y valor real.
La IA no ha fracasado porque empiece a ser cara. Al contrario, se está volviendo cara porque se está usando de verdad. La pregunta incómoda es quién captura el valor de ese uso: el proveedor del modelo, la plataforma de desarrollo, el cloud que ejecuta la inferencia o la empresa que debería transformar esos tokens en productividad medible.
Preguntas frecuentes
¿Por qué la IA empresarial se está encareciendo?
Porque el uso ha pasado de pruebas puntuales a herramientas integradas en el trabajo diario, agentes de programación, automatizaciones y sesiones largas que consumen muchos más tokens.
¿Qué son los AI Credits de GitHub Copilot?
Son unidades de facturación que reflejan el consumo de modelos de IA en Copilot. Se calculan a partir de tokens de entrada, salida y caché, según el modelo utilizado.
¿Desaparecerán las licencias de tarifa plana en IA?
No necesariamente, pero tenderán a incluir límites, créditos, presupuestos o cargos adicionales para usos intensivos. La tarifa plana sin control es difícil de sostener con agentes autónomos.
¿Qué deberían hacer las empresas?
Medir consumo por equipo y caso de uso, fijar presupuestos, elegir modelos según la tarea, usar caché, revisar contratos y tratar la IA como una infraestructura variable, no como una simple licencia de software.