Claude Fable 5 lleva los modelos frontera a uso general, pero con límites

Anthropic ha lanzado Claude Fable 5, su nuevo modelo de uso general más avanzado, junto a Claude Mythos 5, una versión restringida destinada inicialmente a ciberdefensores, proveedores de infraestructura crítica y programas de acceso confiable. La compañía intenta resolver una tensión cada vez más visible en la industria de la inteligencia artificial: cómo abrir capacidades de frontera a millones de usuarios sin entregar también herramientas demasiado potentes a actores maliciosos.

La respuesta de Anthropic no ha sido lanzar un único modelo para todos, sino separar acceso y salvaguardas. Fable 5 llega al mercado con filtros específicos para áreas sensibles como ciberseguridad, biología, química y destilación de modelos. Mythos 5, en cambio, conserva la misma base técnica, pero con algunas restricciones levantadas para usuarios verificados. Es una decisión que anticipa una nueva fase en la IA comercial: los modelos más potentes no se diferenciarán solo por precio o rendimiento, sino por quién puede usar todas sus capacidades.

Un modelo general con salvaguardas más visibles

Claude Fable 5 es, según Anthropic, el modelo más capaz que la compañía ha puesto a disposición del público. Mejora a Opus 4.8 y a Mythos Preview en buena parte de las pruebas publicadas por la empresa, con resultados destacados en programación agéntica, trabajo con conocimiento, visión, razonamiento espacial, uso de herramientas, tareas legales, salud, biología y ciberseguridad.

La tabla comparativa publicada por Anthropic sitúa a Claude Fable 5 y Mythos 5 con un 80,3 % en SWE-Bench Pro, una prueba orientada a programación agéntica. En el benchmark Terminal-Bench 2.1, relacionado también con tareas de código en terminal, el modelo alcanza el 88 %. En otras pruebas, como ExploitBench, la compañía asigna a Mythos/Fable un 78 %, aunque en ese caso se aplican salvaguardas que pueden hacer que determinadas consultas sean gestionadas por un modelo menos sensible.

comparativa claude fable 5 opus otros

Estos datos deben leerse con prudencia. Son benchmarks publicados por el propio proveedor y no sustituyen una evaluación independiente en entornos reales. Aun así, reflejan el foco técnico del lanzamiento: Anthropic quiere que Fable 5 sea visto como un modelo para tareas largas, complejas y con más autonomía, no solo como un chatbot más preciso.

El punto más novedoso está en el mecanismo de seguridad. Cuando Fable 5 detecta una petición relacionada con áreas de alto riesgo, no responde directamente con todo su potencial. El sistema redirige la respuesta a Claude Opus 4.8, un modelo anterior pero aún avanzado. Anthropic asegura que el usuario será avisado cuando eso ocurra y que, de media, más del 95 % de las sesiones no activan ese fallback.

ModeloAccesoEnfoqueRestricciones
Claude Fable 5Uso generalModelo avanzado para programación, análisis, visión y trabajo complejoClasificadores y fallback a Opus 4.8 en áreas sensibles
Claude Mythos 5Acceso restringidoCiberdefensa, infraestructura crítica y programas verificadosSalvaguardas levantadas solo para ciertos usuarios y ámbitos
Claude Opus 4.8Modelo anterior avanzadoRespuesta de respaldo cuando Fable bloquea una peticiónMás limitado en capacidades de riesgo
Claude Mythos PreviewAcceso limitado previoPrimera generación Mythos para socios seleccionadosSustituido o mejorado por Mythos 5

Programación agéntica: menos turnos y tareas más largas

Anthropic dedica una parte importante del anuncio a la ingeniería de software. La compañía sostiene que Fable 5 puede trabajar de forma autónoma durante más tiempo que modelos Claude anteriores y resolver problemas de mayor alcance. En pruebas tempranas, Stripe habría usado el modelo para completar en un día una migración sobre una base de código Ruby de 50 millones de líneas que, según el testimonio citado por Anthropic, habría requerido más de dos meses de trabajo manual para un equipo.

El dato puede sonar excepcional, pero apunta a un cambio real en el mercado. Los modelos de programación ya no se evalúan solo por completar una función o corregir un bug. Las empresas están empezando a medir si pueden ejecutar migraciones, refactorizaciones, análisis de repositorios grandes, generación de pruebas, revisión de dependencias y tareas distribuidas entre varias herramientas.

En ese contexto, Fable 5 compite en el terreno de los agentes de desarrollo. Anthropic destaca que el modelo necesita menos andamiaje y menos turnos para completar tareas complejas. También lo presenta como más eficiente en tokens, una variable que importa cuando una tarea implica leer miles de archivos, mantener memoria, iterar soluciones y validar resultados.

El salto también encaja con una tendencia más amplia: el desarrollo asistido por IA se está desplazando desde el autocompletado hacia la delegación. El usuario no pide “escribe esta función”, sino “migra este módulo”, “moderniza esta parte del sistema”, “encuentra por qué falla esta integración” o “convierte este prototipo en una aplicación desplegable”. Cuanto más larga es la tarea, más importa la memoria, la planificación y la capacidad de corregirse.

Visión, memoria y ciencia: más allá del código

Claude Fable 5 también se presenta como un avance en visión. Anthropic afirma que puede extraer números precisos de figuras científicas, interpretar tablas, reconstruir interfaces a partir de capturas y resolver tareas visuales con menos herramientas externas. Uno de los ejemplos más llamativos es Pokémon FireRed: Fable 5 habría completado el juego usando solo capturas de pantalla, sin mapas ni información estructurada adicional del estado del juego.

La anécdota tiene más valor técnico del que parece. Jugar a un videojuego desde imágenes sin acceso directo al estado interno exige percepción visual, memoria, planificación, navegación y adaptación a errores. No prueba por sí sola inteligencia general, pero sí muestra avances en tareas multimodales largas.

En conocimiento y análisis, Anthropic señala mejoras en benchmarks financieros, interpretación documental y razonamiento sobre gráficos y tablas. Para clientes empresariales, este tipo de capacidades puede ser más importante que una puntuación aislada en programación. Muchas tareas corporativas combinan documentos extensos, hojas de cálculo, contratos, presentaciones, datos financieros y decisiones de negocio.

Mythos 5, por su parte, aparece ligado a investigación científica avanzada. Anthropic asegura que el modelo ha ayudado a acelerar partes del diseño de proteínas y a generar hipótesis novedosas en biología molecular. También afirma que realizó trabajo de investigación en genómica durante más de una semana con intervención humana limitada, ensamblando datos unicelulares de millones de células de 138 especies animales y entrenando un modelo propio más pequeño que otro publicado en Science, pero con mejor rendimiento en la tarea descrita por la compañía.

Estas afirmaciones son importantes, pero también explican por qué Anthropic introduce restricciones más fuertes. Las capacidades que ayudan a diseñar terapias o investigar proteínas pueden tener usos duales. Lo mismo ocurre con ciberseguridad: un modelo que ayuda a encontrar vulnerabilidades puede servir para defender sistemas o para atacarlos.

La seguridad se convierte en parte del producto

El lanzamiento de Fable 5 muestra que la seguridad ya no es una nota al pie en los modelos frontera. Anthropic ha decidido colocarla en el centro de la experiencia. El modelo incluye clasificadores específicos para detectar peticiones de ciberseguridad ofensiva, biología, química y destilación de capacidades. En esos casos, la petición se deriva a Opus 4.8.

La compañía afirma que ha probado estas barreras con red teaming interno y externo, además de un programa de bug bounty con más de 1.000 horas de pruebas sin encontrar jailbreaks universales. Aun así, Anthropic admite que es probablemente imposible eliminar por completo ese riesgo. Su objetivo es hacer que cualquier intento de evasión sea lo bastante lento y costoso como para detectarlo antes de que pueda escalar.

El enfoque generará fricciones. Un investigador, un administrador de sistemas o un desarrollador de seguridad puede ver cómo una petición legítima se redirige a un modelo menos capaz. Anthropic reconoce que habrá falsos positivos y asegura que trabajará para reducirlos. La decisión refleja un dilema difícil: cuanto más capaz es el modelo, mayor es el coste de equivocarse por exceso o por defecto.

También hay una novedad relevante para clientes empresariales: Anthropic aplicará una retención obligatoria de 30 días al tráfico de Fable 5, Mythos 5 y futuros modelos de capacidad similar o superior. La empresa asegura que esos datos no se usarán para entrenar nuevos modelos ni para fines ajenos a seguridad, y que servirán para detectar ataques complejos, intentos de jailbreak distribuidos y falsos positivos. Para organizaciones con requisitos estrictos de privacidad, esta política será un punto a revisar antes de adoptar el modelo en determinados flujos.

Precio y disponibilidad

Fable 5 está disponible desde el lanzamiento para uso general. Mythos 5 se limita inicialmente a los socios de Project Glasswing y, próximamente, a determinados investigadores biomédicos mediante programas de acceso confiable. Anthropic planea ampliar el acceso de forma gradual.

El precio de ambos modelos será de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida, menos de la mitad de Claude Mythos Preview, según la compañía. Los desarrolladores podrán utilizar Fable 5 mediante la API con el identificador claude-fable-5.

La disponibilidad en planes de suscripción será más cauta. Anthropic incluirá Fable 5 temporalmente en Pro, Max, Team y planes Enterprise por asiento hasta el 22 de junio. A partir del 23 de junio, el uso requerirá créditos, salvo que la capacidad permita ampliar esa ventana. En API y planes Enterprise basados en consumo, estará disponible desde el primer día.

La lectura tecnológica es clara. Anthropic no solo lanza un modelo más potente; está ensayando un sistema de distribución por niveles para capacidades de alto riesgo. Fable 5 será el modelo frontera para el gran público. Mythos 5 será la versión de confianza para ámbitos donde esas mismas capacidades pueden ser necesarias, pero también peligrosas.

Ese modelo de acceso escalonado podría marcar el camino para otros proveedores. A medida que la IA gane capacidad en programación, ciberseguridad, biología, química, investigación autónoma y uso de herramientas, la industria tendrá que decidir algo más complejo que qué modelo es mejor: quién puede usarlo sin filtros, quién necesita controles y quién debe quedarse fuera.

Preguntas frecuentes

¿Qué es Claude Fable 5?

Claude Fable 5 es el nuevo modelo avanzado de Anthropic para uso general, diseñado para tareas complejas de programación, análisis, visión, conocimiento y trabajo autónomo de larga duración.

¿Qué es Claude Mythos 5?

Claude Mythos 5 es la misma base de modelo que Fable 5, pero con algunas salvaguardas levantadas para usuarios verificados, inicialmente en ciberdefensa e infraestructura crítica.

¿Por qué Fable 5 redirige algunas respuestas a Opus 4.8?

Porque Anthropic aplica clasificadores de seguridad en áreas como ciberseguridad, biología, química y destilación. Cuando una petición se considera sensible, la respuesta pasa a Claude Opus 4.8.

¿Cuánto cuesta Claude Fable 5?

Anthropic ha fijado un precio de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida para Fable 5 y Mythos 5.

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO

Las últimas novedades de tecnología y cloud

Suscríbete gratis al boletín de Revista Cloud. Cada semana la actualidad en tu buzón.

Suscripción boletín
×