OpenAI estaría estudiando una rebaja agresiva en el precio de sus tokens para defender su posición frente al avance de Anthropic en el mercado profesional de inteligencia artificial. La información, adelantada por The Wall Street Journal y recogida por Reuters, no ha sido confirmada oficialmente por la compañía, pero encaja con una tendencia que ya se nota en empresas y desarrolladores: el coste de usar modelos avanzados se ha convertido en un factor tan importante como la calidad de las respuestas.
La posible bajada llega en un momento en el que la IA empieza a pasar de la fase de experimentación a un uso más continuo. Muchas compañías ya no hacen una prueba aislada con ChatGPT, Claude o un modelo integrado en su software interno. Están desplegando agentes, asistentes de programación, sistemas de soporte, análisis documental, automatización de procesos y herramientas internas que generan miles o millones de peticiones. Cuando eso ocurre, el precio por token deja de ser una línea técnica en una documentación de API y se convierte en una partida presupuestaria.
El token se convierte en la nueva unidad económica de la IA
En el mercado de modelos de lenguaje, el token funciona como la unidad básica de facturación. Las empresas pagan por la información que envían al modelo y por la respuesta que reciben. El coste varía según el modelo, el tamaño del contexto, la velocidad de procesamiento, el tipo de uso y si se aplican descuentos por lotes, caché o baja prioridad.
OpenAI mantiene actualmente una estructura escalonada. GPT-5.5 aparece con 5 dólares por millón de tokens de entrada y 30 dólares por millón de tokens de salida. GPT-5.4 baja a 2,50 y 15 dólares, mientras GPT-5.4 mini se sitúa en 0,75 y 4,50 dólares. También existen opciones más económicas, como GPT-5.4 nano, y descuentos relevantes mediante Batch API o Flex para cargas asíncronas o menos urgentes.
Anthropic, por su parte, compite con una gama donde Claude Fable 5 y Mythos 5 se sitúan en 10 dólares por millón de tokens de entrada y 50 dólares por millón de salida. Opus 4.8 aparece en 5 y 25 dólares, Sonnet 4.6 en 3 y 15 dólares, y Haiku 4.5 en 1 y 5 dólares.
| Proveedor y modelo | Entrada por 1M tokens | Salida por 1M tokens | Posicionamiento |
|---|---|---|---|
| OpenAI GPT-5.5 | 5 $ | 30 $ | Modelo avanzado para tareas exigentes |
| OpenAI GPT-5.4 | 2,50 $ | 15 $ | Gama intermedia |
| OpenAI GPT-5.4 mini | 0,75 $ | 4,50 $ | Uso masivo y tareas de menor coste |
| OpenAI GPT-5.4 nano | 0,20 $ | 1,25 $ | Automatización simple y alto volumen |
| Anthropic Claude Fable 5 | 10 $ | 50 $ | Modelo premium para agentes y trabajo complejo |
| Anthropic Claude Opus 4.8 | 5 $ | 25 $ | Gama avanzada |
| Anthropic Claude Sonnet 4.6 | 3 $ | 15 $ | Equilibrio entre capacidad y coste |
| Anthropic Claude Haiku 4.5 | 1 $ | 5 $ | Opción económica dentro de Claude |
La tabla muestra que la competencia no se reduce a “OpenAI caro frente a Anthropic barato”. Hay modelos de distintos niveles en ambos catálogos. La batalla está en el precio efectivo por tarea resuelta. Un modelo puede cobrar más por token, pero necesitar menos pasos. Otro puede ser más barato, pero requerir más contexto, más reintentos o más supervisión humana.
Anthropic puede responder, pero no necesariamente bajando todo
La gran pregunta es si Anthropic entrará en una guerra de precios abierta. La respuesta más probable es que sí responderá, pero con cuidado. No parece razonable que rebaje de forma inmediata toda su gama premium, especialmente después de presentar Claude Fable 5 y Mythos 5 como modelos de alto valor para trabajo profesional, agentes y programación. Una rebaja general podría defender cuota, pero también reduciría el margen en una infraestructura cara de operar.
Anthropic tiene otras vías para competir. Puede ofrecer descuentos por volumen a grandes clientes, ampliar créditos en planes de empresa, mejorar el coste real mediante prompt caching, empujar cargas a Batch Processing con descuentos del 50 %, ajustar modelos intermedios como Sonnet o Haiku, o crear tarifas específicas para casos de uso de alto consumo, como agentes de programación.
| Movimiento posible de Anthropic | Probabilidad | Efecto probable |
| Rebaja general de Fable 5 | Baja o media | Defensa agresiva de cuota, pero presión directa sobre margen |
| Descuentos enterprise por volumen | Alta | Competencia en grandes cuentas sin cambiar precios públicos |
| Más créditos incluidos en suscripciones | Alta | Retención de usuarios profesionales |
| Impulso de Batch Processing | Alta | Menor coste para cargas no urgentes |
| Mejora de prompt caching | Alta | Reducción del coste real en tareas largas |
| Ajuste de Sonnet o Haiku | Media-alta | Defensa de volumen en tareas comunes |
| Tarifas específicas para coding agents | Media | Ataque directo al mercado de desarrolladores |
Esta respuesta selectiva tendría sentido porque Anthropic ha ganado reputación en usos profesionales donde la calidad pesa mucho. Claude Code ha conseguido visibilidad entre desarrolladores, y los modelos Claude se usan en tareas de programación, análisis largo y trabajo con documentos. La compañía puede intentar defender ese espacio no solo con precio, sino con rendimiento, fiabilidad y experiencia de uso.
Programación y agentes: donde la factura se dispara
La presión sobre precios se nota especialmente en agentes de programación. Un asistente de código no se limita a responder una pregunta. Puede leer múltiples archivos, entender dependencias, proponer cambios, generar pruebas, ejecutar herramientas, interpretar errores y volver a intentarlo. Cada paso consume tokens.
En un uso individual, el coste puede parecer asumible. En un equipo de ingeniería con decenas o cientos de desarrolladores usando agentes a diario, la factura cambia de escala. Ahí una diferencia de unos pocos dólares por millón de tokens puede convertirse en miles o millones al año, dependiendo del volumen.
También ocurre en soporte al cliente, revisión documental, análisis de contratos, automatización de backoffice o agentes internos que ejecutan tareas encadenadas. Cuanto más autónomo es el sistema, más contexto suele necesitar y más iteraciones realiza. La eficiencia del modelo importa, pero el precio también.
| Caso de uso | Por qué consume muchos tokens | Sensibilidad al precio |
| Agentes de programación | Leen código, generan cambios y repiten pruebas | Muy alta |
| Soporte automatizado | Procesan historiales, políticas y respuestas largas | Alta |
| Análisis documental | Trabajan con documentos extensos y contexto acumulado | Alta |
| Agentes internos | Encadenan pasos, herramientas y validaciones | Muy alta |
| Generación de contenido | Produce muchas variantes y revisiones | Media |
| Clasificación simple | Tareas cortas y repetitivas | Muy alta si el volumen es masivo |
Por eso OpenAI tiene incentivos para mover precio. Si consigue abaratar el uso de GPT-5.5 o de sus modelos intermedios sin degradar rendimiento, puede capturar más cargas empresariales antes de que Anthropic consolide una posición fuerte en flujos profesionales.
Bajar precios no elimina el coste real de la infraestructura
El problema es que la IA generativa no tiene los márgenes típicos del software clásico. Cada llamada al modelo consume computación, memoria, red, energía y capacidad de centro de datos. La inferencia avanzada, especialmente en modelos grandes y contextos largos, no es gratuita ni aunque el software esté perfectamente optimizado.
OpenAI y Anthropic han levantado capital y firmado grandes acuerdos de infraestructura precisamente porque servir IA a escala exige una inversión enorme. Rebajar precios puede aumentar adopción, pero también elevar la demanda de GPU y presionar la disponibilidad. Si el volumen adicional no compensa el menor ingreso por token, los márgenes se estrechan.
La jugada, por tanto, no es sencilla. OpenAI puede bajar precios para ganar cuota, pero tendrá que apoyarse en modelos más eficientes, caché, batch, hardware propio o acuerdos cloud más favorables. Anthropic afronta el mismo dilema. En el fondo, ambos compiten por demostrar que pueden vender inteligencia artificial a gran escala sin que el coste de servirla se coma el negocio.
La guerra real será por el coste de tarea, no por el token
A medio plazo, las empresas no compararán solo el precio por millón de tokens. Compararán el coste de resolver una tarea completa. Cuánto cuesta cerrar un ticket. Cuánto cuesta revisar un repositorio. Cuánto cuesta analizar mil contratos. Cuánto cuesta mantener un agente funcionando durante una hora. Cuánto trabajo humano ahorra y cuánta supervisión requiere.
Esto puede favorecer estrategias multi-modelo. Modelos baratos para tareas sencillas. Modelos premium para decisiones complejas. Modelos autoalojados para datos sensibles. Proveedores distintos según latencia, coste, disponibilidad o cumplimiento. La guerra de precios no necesariamente creará un único ganador; puede acelerar la fragmentación del mercado.
| Estrategia empresarial | Ventaja | Riesgo |
| Usar siempre el modelo más potente | Mejor calidad media | Coste elevado |
| Usar siempre el modelo más barato | Ahorro inmediato | Menor fiabilidad en tareas complejas |
| Arquitectura multi-modelo | Equilibrio coste-calidad | Más complejidad técnica |
| Autoalojamiento parcial | Control de datos y coste a escala | Operación más exigente |
| Batch para tareas no urgentes | Descuento relevante | Menor inmediatez |
| Prompt caching | Menor coste en contextos repetidos | Requiere buen diseño de prompts y flujos |
Una buena noticia para usuarios, una presión para proveedores
Para desarrolladores, startups y empresas que ya usan IA, una bajada de precios sería positiva. Permitirá probar más, automatizar más procesos y lanzar productos con menor coste de entrada. También puede ayudar a que herramientas de IA lleguen a usuarios que hasta ahora estaban limitados por presupuestos.
Para los proveedores de modelos, la lectura es más dura. La competencia puede convertir parte del mercado en una carrera de volumen, donde solo sobrevivan quienes tengan la mejor combinación de modelos, infraestructura, distribución y capital. Los modelos pequeños y eficientes ganarán importancia, porque no todas las tareas justifican usar el modelo más caro.
El empleo, por su parte, no depende solo del precio de los tokens. Una IA más barata puede acelerar automatizaciones, pero sustituir trabajo humano exige fiabilidad, integración, responsabilidad legal, datos de calidad y supervisión. Muchas empresas han aprendido que automatizar mal puede salir más caro que mantener equipos humanos. La bajada de precios hará viables más casos, pero no resolverá por sí sola la complejidad organizativa.
La posible rebaja de OpenAI anticipa una etapa más madura y menos romántica de la inteligencia artificial. Ya no basta con presentar un modelo impresionante. Hay que convencer al mercado de que usarlo todos los días tiene sentido económico. Anthropic puede entrar en la guerra, pero probablemente lo hará seleccionando bien dónde cede margen y dónde defiende precio.
La IA empresarial empieza a parecerse a cualquier mercado de infraestructura: rendimiento, coste, disponibilidad y confianza. Quien gane no será solo quien tenga el modelo más brillante, sino quien consiga que cada tarea salga más barata, más rápida y con menos riesgo.
Preguntas frecuentes
¿OpenAI ha confirmado la rebaja de precios?
No. La posible rebaja procede de una información de The Wall Street Journal, recogida por Reuters, que señaló que no pudo verificarla de forma independiente.
¿Por qué quiere bajar precios OpenAI?
La hipótesis es que busca competir mejor con Anthropic en clientes profesionales, programación, agentes de IA y cargas empresariales de alto consumo.
¿Anthropic podría entrar en una guerra de precios?
Sí, aunque probablemente lo haría de forma selectiva, mediante descuentos por volumen, créditos, batch processing, prompt caching o ajustes en modelos concretos.
Qué métrica deberían mirar las empresas?
Más que el precio por millón de tokens, conviene mirar el coste por tarea completada: cuánto cuesta resolver un ticket, revisar código, analizar documentos o ejecutar un agente real.