OpenAI prepara el terreno para una guerra de precios en la IA empresarial

Silvia A. Feliz

OpenAI estaría estudiando una rebaja agresiva en el precio de sus tokens para defender su posición frente al avance de Anthropic en el mercado profesional de inteligencia artificial. La información, adelantada por The Wall Street Journal y recogida por Reuters, no ha sido confirmada oficialmente por la compañía, pero encaja con una tendencia que ya se nota en empresas y desarrolladores: el coste de usar modelos avanzados se ha convertido en un factor tan importante como la calidad de las respuestas.

La posible bajada llega en un momento en el que la IA empieza a pasar de la fase de experimentación a un uso más continuo. Muchas compañías ya no hacen una prueba aislada con ChatGPT, Claude o un modelo integrado en su software interno. Están desplegando agentes, asistentes de programación, sistemas de soporte, análisis documental, automatización de procesos y herramientas internas que generan miles o millones de peticiones. Cuando eso ocurre, el precio por token deja de ser una línea técnica en una documentación de API y se convierte en una partida presupuestaria.

El token se convierte en la nueva unidad económica de la IA

En el mercado de modelos de lenguaje, el token funciona como la unidad básica de facturación. Las empresas pagan por la información que envían al modelo y por la respuesta que reciben. El coste varía según el modelo, el tamaño del contexto, la velocidad de procesamiento, el tipo de uso y si se aplican descuentos por lotes, caché o baja prioridad.

OpenAI mantiene actualmente una estructura escalonada. GPT-5.5 aparece con 5 dólares por millón de tokens de entrada y 30 dólares por millón de tokens de salida. GPT-5.4 baja a 2,50 y 15 dólares, mientras GPT-5.4 mini se sitúa en 0,75 y 4,50 dólares. También existen opciones más económicas, como GPT-5.4 nano, y descuentos relevantes mediante Batch API o Flex para cargas asíncronas o menos urgentes.

Anthropic, por su parte, compite con una gama donde Claude Fable 5 y Mythos 5 se sitúan en 10 dólares por millón de tokens de entrada y 50 dólares por millón de salida. Opus 4.8 aparece en 5 y 25 dólares, Sonnet 4.6 en 3 y 15 dólares, y Haiku 4.5 en 1 y 5 dólares.

Proveedor y modelo	Entrada por 1M tokens	Salida por 1M tokens	Posicionamiento
OpenAI GPT-5.5	5 $	30 $	Modelo avanzado para tareas exigentes
OpenAI GPT-5.4	2,50 $	15 $	Gama intermedia
OpenAI GPT-5.4 mini	0,75 $	4,50 $	Uso masivo y tareas de menor coste
OpenAI GPT-5.4 nano	0,20 $	1,25 $	Automatización simple y alto volumen
Anthropic Claude Fable 5	10 $	50 $	Modelo premium para agentes y trabajo complejo
Anthropic Claude Opus 4.8	5 $	25 $	Gama avanzada
Anthropic Claude Sonnet 4.6	3 $	15 $	Equilibrio entre capacidad y coste
Anthropic Claude Haiku 4.5	1 $	5 $	Opción económica dentro de Claude

La tabla muestra que la competencia no se reduce a “OpenAI caro frente a Anthropic barato”. Hay modelos de distintos niveles en ambos catálogos. La batalla está en el precio efectivo por tarea resuelta. Un modelo puede cobrar más por token, pero necesitar menos pasos. Otro puede ser más barato, pero requerir más contexto, más reintentos o más supervisión humana.

Anthropic puede responder, pero no necesariamente bajando todo

La gran pregunta es si Anthropic entrará en una guerra de precios abierta. La respuesta más probable es que sí responderá, pero con cuidado. No parece razonable que rebaje de forma inmediata toda su gama premium, especialmente después de presentar Claude Fable 5 y Mythos 5 como modelos de alto valor para trabajo profesional, agentes y programación. Una rebaja general podría defender cuota, pero también reduciría el margen en una infraestructura cara de operar.

Anthropic tiene otras vías para competir. Puede ofrecer descuentos por volumen a grandes clientes, ampliar créditos en planes de empresa, mejorar el coste real mediante prompt caching, empujar cargas a Batch Processing con descuentos del 50 %, ajustar modelos intermedios como Sonnet o Haiku, o crear tarifas específicas para casos de uso de alto consumo, como agentes de programación.

Movimiento posible de Anthropic	Probabilidad	Efecto probable
Rebaja general de Fable 5	Baja o media	Defensa agresiva de cuota, pero presión directa sobre margen
Descuentos enterprise por volumen	Alta	Competencia en grandes cuentas sin cambiar precios públicos
Más créditos incluidos en suscripciones	Alta	Retención de usuarios profesionales
Impulso de Batch Processing	Alta	Menor coste para cargas no urgentes
Mejora de prompt caching	Alta	Reducción del coste real en tareas largas
Ajuste de Sonnet o Haiku	Media-alta	Defensa de volumen en tareas comunes
Tarifas específicas para coding agents	Media	Ataque directo al mercado de desarrolladores

Esta respuesta selectiva tendría sentido porque Anthropic ha ganado reputación en usos profesionales donde la calidad pesa mucho. Claude Code ha conseguido visibilidad entre desarrolladores, y los modelos Claude se usan en tareas de programación, análisis largo y trabajo con documentos. La compañía puede intentar defender ese espacio no solo con precio, sino con rendimiento, fiabilidad y experiencia de uso.

Programación y agentes: donde la factura se dispara

La presión sobre precios se nota especialmente en agentes de programación. Un asistente de código no se limita a responder una pregunta. Puede leer múltiples archivos, entender dependencias, proponer cambios, generar pruebas, ejecutar herramientas, interpretar errores y volver a intentarlo. Cada paso consume tokens.

En un uso individual, el coste puede parecer asumible. En un equipo de ingeniería con decenas o cientos de desarrolladores usando agentes a diario, la factura cambia de escala. Ahí una diferencia de unos pocos dólares por millón de tokens puede convertirse en miles o millones al año, dependiendo del volumen.

También ocurre en soporte al cliente, revisión documental, análisis de contratos, automatización de backoffice o agentes internos que ejecutan tareas encadenadas. Cuanto más autónomo es el sistema, más contexto suele necesitar y más iteraciones realiza. La eficiencia del modelo importa, pero el precio también.

Caso de uso	Por qué consume muchos tokens	Sensibilidad al precio
Agentes de programación	Leen código, generan cambios y repiten pruebas	Muy alta
Soporte automatizado	Procesan historiales, políticas y respuestas largas	Alta
Análisis documental	Trabajan con documentos extensos y contexto acumulado	Alta
Agentes internos	Encadenan pasos, herramientas y validaciones	Muy alta
Generación de contenido	Produce muchas variantes y revisiones	Media
Clasificación simple	Tareas cortas y repetitivas	Muy alta si el volumen es masivo

Por eso OpenAI tiene incentivos para mover precio. Si consigue abaratar el uso de GPT-5.5 o de sus modelos intermedios sin degradar rendimiento, puede capturar más cargas empresariales antes de que Anthropic consolide una posición fuerte en flujos profesionales.

Bajar precios no elimina el coste real de la infraestructura

El problema es que la IA generativa no tiene los márgenes típicos del software clásico. Cada llamada al modelo consume computación, memoria, red, energía y capacidad de centro de datos. La inferencia avanzada, especialmente en modelos grandes y contextos largos, no es gratuita ni aunque el software esté perfectamente optimizado.

OpenAI y Anthropic han levantado capital y firmado grandes acuerdos de infraestructura precisamente porque servir IA a escala exige una inversión enorme. Rebajar precios puede aumentar adopción, pero también elevar la demanda de GPU y presionar la disponibilidad. Si el volumen adicional no compensa el menor ingreso por token, los márgenes se estrechan.

La jugada, por tanto, no es sencilla. OpenAI puede bajar precios para ganar cuota, pero tendrá que apoyarse en modelos más eficientes, caché, batch, hardware propio o acuerdos cloud más favorables. Anthropic afronta el mismo dilema. En el fondo, ambos compiten por demostrar que pueden vender inteligencia artificial a gran escala sin que el coste de servirla se coma el negocio.

La guerra real será por el coste de tarea, no por el token

A medio plazo, las empresas no compararán solo el precio por millón de tokens. Compararán el coste de resolver una tarea completa. Cuánto cuesta cerrar un ticket. Cuánto cuesta revisar un repositorio. Cuánto cuesta analizar mil contratos. Cuánto cuesta mantener un agente funcionando durante una hora. Cuánto trabajo humano ahorra y cuánta supervisión requiere.

Esto puede favorecer estrategias multi-modelo. Modelos baratos para tareas sencillas. Modelos premium para decisiones complejas. Modelos autoalojados para datos sensibles. Proveedores distintos según latencia, coste, disponibilidad o cumplimiento. La guerra de precios no necesariamente creará un único ganador; puede acelerar la fragmentación del mercado.

Estrategia empresarial	Ventaja	Riesgo
Usar siempre el modelo más potente	Mejor calidad media	Coste elevado
Usar siempre el modelo más barato	Ahorro inmediato	Menor fiabilidad en tareas complejas
Arquitectura multi-modelo	Equilibrio coste-calidad	Más complejidad técnica
Autoalojamiento parcial	Control de datos y coste a escala	Operación más exigente
Batch para tareas no urgentes	Descuento relevante	Menor inmediatez
Prompt caching	Menor coste en contextos repetidos	Requiere buen diseño de prompts y flujos

Una buena noticia para usuarios, una presión para proveedores

Para desarrolladores, startups y empresas que ya usan IA, una bajada de precios sería positiva. Permitirá probar más, automatizar más procesos y lanzar productos con menor coste de entrada. También puede ayudar a que herramientas de IA lleguen a usuarios que hasta ahora estaban limitados por presupuestos.

Para los proveedores de modelos, la lectura es más dura. La competencia puede convertir parte del mercado en una carrera de volumen, donde solo sobrevivan quienes tengan la mejor combinación de modelos, infraestructura, distribución y capital. Los modelos pequeños y eficientes ganarán importancia, porque no todas las tareas justifican usar el modelo más caro.

El empleo, por su parte, no depende solo del precio de los tokens. Una IA más barata puede acelerar automatizaciones, pero sustituir trabajo humano exige fiabilidad, integración, responsabilidad legal, datos de calidad y supervisión. Muchas empresas han aprendido que automatizar mal puede salir más caro que mantener equipos humanos. La bajada de precios hará viables más casos, pero no resolverá por sí sola la complejidad organizativa.

La posible rebaja de OpenAI anticipa una etapa más madura y menos romántica de la inteligencia artificial. Ya no basta con presentar un modelo impresionante. Hay que convencer al mercado de que usarlo todos los días tiene sentido económico. Anthropic puede entrar en la guerra, pero probablemente lo hará seleccionando bien dónde cede margen y dónde defiende precio.

La IA empresarial empieza a parecerse a cualquier mercado de infraestructura: rendimiento, coste, disponibilidad y confianza. Quien gane no será solo quien tenga el modelo más brillante, sino quien consiga que cada tarea salga más barata, más rápida y con menos riesgo.

Preguntas frecuentes

¿OpenAI ha confirmado la rebaja de precios?

No. La posible rebaja procede de una información de The Wall Street Journal, recogida por Reuters, que señaló que no pudo verificarla de forma independiente.

¿Por qué quiere bajar precios OpenAI?

La hipótesis es que busca competir mejor con Anthropic en clientes profesionales, programación, agentes de IA y cargas empresariales de alto consumo.

¿Anthropic podría entrar en una guerra de precios?

Sí, aunque probablemente lo haría de forma selectiva, mediante descuentos por volumen, créditos, batch processing, prompt caching o ajustes en modelos concretos.

Qué métrica deberían mirar las empresas?

Más que el precio por millón de tokens, conviene mirar el coste por tarea completada: cuánto cuesta resolver un ticket, revisar código, analizar documentos o ejecutar un agente real.