
Claude Sonnet 4.5 y la promesa de los agentes que “programan solos”: entre el salto de 30 horas continuas y el viejo problema de entregar software que funcione
Anthropic ha encendido el debate sobre la programación autónoma al presentar Claude Sonnet 4.5 con un ejemplo tan simple de entender como difícil de replicar: un agente que estuvo 30 horas seguidas generando unas 11.000 líneas de código para “clonar” una aplicación tipo Slack/Teams y que detuvo su ejecución al “completar” la tarea. El hito multiplica por más de cuatro las 7 horas que, en mayo, se atribuyeron a Opus 4. Para la compañía, el mensaje es claro: Sonnet 4.5 sería “el mejor modelo del mundo para agentes reales, programación y uso de ordenadores”. El anuncio llega en medio de una batalla de fondo entre Anthropic, OpenAI y Google por ganar el mercado empresarial de agentes autónomos: asistentes que navegan,