La presentación de los nuevos Computer-Using Agents (CUA) de Microsoft en su plataforma Copilot Studio podría marcar un punto de inflexión en la evolución del mercado de la inteligencia artificial. Y, para muchos observadores del sector, este movimiento tiene un sabor familiar. Porque no es solo una cuestión de innovación tecnológica, sino de distribución, escala y ecosistema. Es decir, de estrategia.
Del déjà vu: Slack vs Teams… ahora versión IA
La historia reciente ofrece un paralelismo elocuente. Slack revolucionó el mundo de la comunicación empresarial. Microsoft respondió con Teams, que se integró en su suite Office 365 y, en poco tiempo, superó a su competidor. No necesariamente por ser mejor, sino por estar en el lugar adecuado, con la integración adecuada y con el músculo comercial adecuado.
Hoy, algo similar puede estar ocurriendo en el mundo de los agentes inteligentes:
- OpenAI lanza Operator y otras startups innovan en automatización autónoma.
- Microsoft toma esa misma tecnología —en gran parte también basada en OpenAI— y la convierte en CUA dentro de su plataforma Copilot.
- Pero no la lanza como una herramienta aparte, sino integrada directamente en su infraestructura empresarial ya desplegada a escala global.
Y eso cambia las reglas del juego.
¿Qué son los Computer-Using Agents?
Los nuevos agentes de Copilot Studio no dependen de APIs ni de integraciones a medida. Literalmente pueden “ver” la pantalla, interpretar elementos de la interfaz gráfica, hacer clics, rellenar formularios, navegar por aplicaciones web o de escritorio, y hacerlo con instrucciones en lenguaje natural. Son una especie de RPA (automatización robótica de procesos) de nueva generación, impulsados por modelos de lenguaje, con razonamiento autónomo y capacidad de adaptación en tiempo real.
Estos agentes permiten:
- Automatizar procesos en apps sin API
- Adaptarse a cambios visuales dinámicos
- Registrar su actividad y razonamiento para auditorías
- Ejecutarse de forma segura dentro de la nube de Microsoft
La ventaja estratégica de Microsoft no está solo en la IA
Si algo ha quedado claro en los últimos años, es que tener la tecnología más avanzada no basta. Lo que importa es la capacidad de poner esa tecnología en manos de millones de usuarios de forma rápida y confiable.
Y en ese frente, Microsoft tiene una ventaja abrumadora:
- Ecosistema: Office, Teams, Dynamics, Azure, Windows. Integración directa y nativa.
- Usuarios: Centenares de millones de usuarios empresariales activos.
- Distribución: Canales ya establecidos con departamentos IT y decisores corporativos.
- Seguridad y compliance: Microsoft cumple con las normativas más exigentes (GDPR, HIPAA, ISO).
- Coste marginal nulo: Para muchas empresas, añadir una nueva función Copilot es tan simple como activar una licencia más.
OpenAI, Anthropic, Perplexity o cualquier startup con una gran IA no puede replicar eso de la noche a la mañana.
¿Qué cambia con esta nueva generación de agentes?
Si los chatbots eran asistentes de conversación, estos nuevos agentes son operadores autónomos. No te dicen qué hacer. Lo hacen por ti. Y lo hacen como lo haría una persona frente a la pantalla, pero más rápido, sin descanso y a escala.
Casos de uso reales ya planteados por Microsoft incluyen:
- Introducción de datos masivos en sistemas antiguos
- Automatización del procesamiento de facturas
- Recopilación de información desde webs para inteligencia de mercado
- Interacción con sistemas cerrados sin soporte de integración
Y todo esto sin necesidad de desarrollo a medida ni código complejo.
¿Quién gana la batalla de los agentes?
Si consideramos que:
- La adopción depende de la facilidad de uso e integración
- La IA más potente necesita una vía para llegar al usuario final
- El mayor valor está en resolver problemas reales, no en demostrar benchmarks
… entonces Microsoft tiene todas las papeletas para liderar el mercado empresarial de agentes autónomos. Tal y como ocurrió con Teams. Tal y como está ocurriendo con Copilot en Office. Y, probablemente, como ocurrirá con los CUA.
Reflexión final: ¿la era post-API?
En este nuevo paradigma, la interfaz gráfica deja de ser una barrera. Los agentes no necesitan permisos especiales, ni integraciones complejas. Pueden operar como un humano, pero con la velocidad y resiliencia de una máquina.
Esto podría inaugurar la era post-API, donde cualquier software, por antiguo o cerrado que sea, puede ser automatizado sin tocar su backend.
Y si eso ocurre, los que ya tienen la pantalla y el escritorio —es decir, Microsoft— pueden ganar por simple posición de ventaja.
¿Estamos ante un nuevo monopolio silencioso? ¿O ante una democratización radical de la automatización?
El debate está servido. Pero una cosa parece clara: la IA ya no solo responde. Ahora actúa.
📌 Más información oficial: https://www.microsoft.com/en-us/copilot/blog/copilot-studio-ui-automation-preview