Anthropic retiene Mythos y convierte la IA ofensiva en asunto industrial

Antonio

Anthropic ha decidido hacer algo poco habitual en el sector de la Inteligencia Artificial: anunciar uno de sus modelos más avanzados y, al mismo tiempo, dejar claro que no piensa abrirlo al público general. La compañía presentó el 7 de abril Claude Mythos Preview, un nuevo modelo generalista que, según sus propias evaluaciones, ha dado un salto muy notable en tareas de ciberseguridad ofensiva y defensiva. La empresa sostiene que el sistema ha sido capaz de encontrar y explotar vulnerabilidades zero-day en los principales sistemas operativos y navegadores durante sus pruebas internas, y que esa mejora es lo bastante seria como para justificar un despliegue muy restringido.

La respuesta de Anthropic no ha sido comercializar Mythos como una nueva versión premium de Claude, sino activar Project Glasswing, una iniciativa conjunta con Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks. El objetivo es que un grupo limitado de grandes actores use el modelo para reforzar software e infraestructuras críticas antes de que capacidades similares empiecen a proliferar en otros sistemas. Anthropic ha comprometido hasta 100 millones de dólares en créditos de uso del modelo y 4 millones de dólares adicionales para organizaciones de seguridad open source.

El mensaje no es “hemos lanzado un modelo”, sino “hemos cruzado un umbral”

Lo más relevante del anuncio no está solo en los números de rendimiento, sino en la tesis que Anthropic pone encima de la mesa. La compañía afirma que Mythos Preview no fue entrenado de forma específica para explotar software, sino que sus capacidades en ciberseguridad emergieron como consecuencia de mejoras más generales en razonamiento, programación y autonomía. Ese matiz es importante porque sugiere que el salto ofensivo no depende necesariamente de entrenamientos ultraespecializados, sino de que los modelos de propósito general sigan mejorando en código y coordinación de tareas.

En su informe técnico, Anthropic asegura que Mythos encontró fallos de alto impacto en OpenBSD, FFmpeg, FreeBSD, bibliotecas criptográficas, aplicaciones web, máquinas virtuales y el kernel de Linux. También sostiene que fue capaz de encadenar varias vulnerabilidades para construir exploits funcionales, y que el modelo supera claramente a Opus 4.6 en tareas de explotación autónoma. Entre los ejemplos que sí ha hecho públicos figura un fallo ya corregido de 27 años en OpenBSD, una vulnerabilidad de 16 años en FFmpeg y un remote code execution en el servidor NFS de FreeBSD que terminó identificado como CVE-2026-4747. Anthropic subraya además que más del 99 % de los hallazgos que ha detectado todavía no estaban parcheados al redactar su informe, lo que limita los detalles que puede revelar por razones de divulgación responsable.

Glasswing es una reacción defensiva, pero también una advertencia al mercado

El enfoque elegido por Anthropic revela que la empresa considera Mythos algo más sensible que un modelo convencional. Glasswing no se plantea como un programa beta para clientes curiosos, sino como una especie de despliegue controlado para actores con responsabilidades claras sobre software crítico. Reuters lo resumió como un intento de poner una tecnología potencialmente muy peligrosa primero en manos de defensores antes de que capacidades equivalentes acaben disponibles de forma más amplia.

Ese planteamiento cambia bastante el tono habitual del sector. Durante los dos últimos años, la industria ha tendido a presentar cada salto de capacidad como una mejora comercial directa. Aquí, en cambio, la narrativa es casi la contraria: Anthropic viene a decir que el modelo es demasiado potente en una dimensión concreta como para abrirlo sin más. El mensaje implícito es que la ciberseguridad está dejando de ser un dominio lateral dentro de la IA para convertirse en una de las áreas donde un avance técnico puede alterar antes el equilibrio de poder entre defensores y atacantes.

Más allá del marketing: lo que cambia para el ecosistema tecnológico

Para un medio tecnológico, la lectura interesante no es solo si Anthropic exagera o no sus pruebas, sino qué tendencia está intentando anticipar. Si modelos como Mythos reducen mucho el coste de encontrar, clasificar y explotar fallos, entonces el ciclo clásico de seguridad —descubrimiento, validación, parcheo, despliegue— se acelera y se vuelve más agresivo. Eso afecta a fabricantes de software, mantenedores open source, distribuidores, responsables de infraestructura cloud y equipos de respuesta a incidentes. Anthropic insiste precisamente en eso: no basta con encontrar vulnerabilidades más rápido, también habrá que triarlas antes, parchearlas antes y desplegar actualizaciones con menos demora.

Glasswing también deja claro que la próxima fase de la seguridad ofensiva y defensiva será mucho más industrial. No es casual que en el programa aparezcan hyperscalers, proveedores de ciberseguridad, grandes bancos y organizaciones ligadas al software abierto. Cada uno controla una parte del ataque superficial global: nube, endpoint, servicios financieros, librerías críticas, compiladores, kernels, marcos criptográficos y software de base. Si Anthropic tiene razón y el volumen de vulnerabilidades encontrables con IA va a crecer de forma drástica, ninguna organización grande podrá afrontarlo con procesos puramente manuales.

Los benchmarks importan, pero el dato clave es la decisión de no abrirlo

Anthropic acompaña el anuncio con comparativas en CyberGym y en varios benchmarks de desarrollo como SWE-bench Verified, SWE-bench Pro, Terminal-Bench 2.0, BrowseComp y otros. En todos ellos coloca a Mythos por encima de Opus 4.6, a veces con márgenes muy amplios. La compañía también reconoce algunos matices técnicos, como posibles señales de memorización en Humanity’s Last Exam y diferencias metodológicas en algunas pruebas multimodales. Todo eso importa, pero el dato realmente diferencial es otro: la empresa ha preferido tratar este modelo como una herramienta de uso restringido antes que como un producto abierto de mercado.

Eso convierte a Mythos en una señal más amplia para la industria. Incluso si otros laboratorios no comparten el mismo ritmo o la misma evaluación de riesgo, la dirección parece clara: la combinación de modelos más autónomos, mejor código y mejor razonamiento está empezando a tocar una zona especialmente sensible, la de la explotación automatizada de vulnerabilidades. La propia Anthropic sostiene que, a largo plazo, estas capacidades deberían beneficiar más a los defensores que a los atacantes, igual que ocurrió con herramientas como los fuzzers. Pero también admite que el periodo de transición puede ser turbulento. Y esa es, probablemente, la frase más importante de todo el anuncio.

Preguntas frecuentes

¿Qué es exactamente Claude Mythos Preview?
Es un modelo generalista de Anthropic presentado el 7 de abril de 2026 con un rendimiento especialmente fuerte en tareas de ciberseguridad, como búsqueda de vulnerabilidades, generación de exploits, ingeniería inversa y cadenas de ataque, según las evaluaciones internas de la propia empresa. Anthropic no planea hacerlo disponible de forma general por ahora.

¿Qué es Project Glasswing?
Es una iniciativa coordinada por Anthropic para que un grupo limitado de grandes empresas y organizaciones que mantienen software crítico utilicen Mythos Preview con fines defensivos. Entre los socios figuran AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA y Palo Alto Networks.

¿Anthropic ha demostrado de forma independiente que Mythos encuentra miles de zero-days?
No de forma completa e independiente por ahora. La empresa ha publicado ejemplos técnicos concretos y afirma que la inmensa mayoría de los hallazgos siguen sin poder detallarse porque todavía no estaban parcheados al escribir el informe. Eso deja parte de sus afirmaciones más fuertes pendientes de verificación pública posterior.

¿Se podrá usar Mythos en la API o en grandes nubes?
Sí, pero solo dentro del programa y por invitación. Anthropic indica que los participantes pueden acceder al modelo a través de su API y de plataformas como Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry.

Fuente: Anthropic presenta Mythos