La compañía lanza un botón universal para impedir el rastreo automatizado de contenido web por parte de empresas de inteligencia artificial sin consentimiento
En una decisión que podría marcar un antes y un después en la batalla por los derechos del contenido original en Internet, Cloudflare ha anunciado la activación de una nueva funcionalidad: un botón que permite bloquear todos los bots y rastreadores de inteligencia artificial con un solo clic. La herramienta está disponible incluso para los usuarios del plan gratuito.
La medida responde al creciente malestar de editores, medios, empresas y creadores digitales ante el uso masivo de su contenido para entrenar modelos de IA sin permiso ni compensación económica. En palabras de Matthew Prince, CEO de Cloudflare: “Los rastreadores de IA han estado raspando contenidos sin límites. Nuestro objetivo es devolver el poder a los creadores.”
El valor de los datos y el auge de los bots silenciosos
El auge de la inteligencia artificial generativa ha disparado la demanda de contenido original: desde artículos y ensayos hasta comentarios de usuarios. Empresas como Google han llegado a pagar cifras millonarias por acceder legalmente a estos datos (como los 60 millones de dólares anuales pagados a Reddit), pero otras compañías han optado por métodos menos transparentes.
Uno de los casos más polémicos es el de Perplexity, a la que se ha acusado de camuflar sus bots como visitantes normales para saltarse las restricciones de acceso. Frente a esta opacidad, Cloudflare ha optado por una medida clara y contundente.
¿Cómo funciona este nuevo sistema de bloqueo?
Desde ahora, cualquier cliente de Cloudflare puede ir al panel de control y, en el apartado de Seguridad > Bots, activar la opción «AI Scrapers and Crawlers». Al hacerlo, su sitio web quedará blindado ante los bots identificados como recolectores de datos para IA.
Esta lista se actualizará automáticamente con nuevas firmas a medida que se detecten comportamientos de scraping masivo, y el sistema se integra con los algoritmos de aprendizaje automático de Cloudflare para identificar actividades sospechosas incluso cuando los bots traten de disfrazarse.
Radiografía de los bots más activos
Según datos recogidos por Cloudflare en junio de 2025, los bots más activos en su red son:
Bot de IA | Porcentaje de sitios accedidos |
---|---|
Bytespider | 40,40 % |
GPTBot | 35,46 % |
ClaudeBot | 11,17 % |
ImagesiftBot | 8,75 % |
CCBot | 2,14 % |
Bytespider, operado por ByteDance (la empresa matriz de TikTok), es uno de los más agresivos, y GPTBot —gestionado por OpenAI— no se queda atrás. Pese a la inclusión de restricciones en archivos robots.txt, muchos de estos bots ignoran dichas instrucciones o manipulan su identificación.
Pago por rastreo: monetizar el acceso a contenido original
En paralelo al bloqueo, Cloudflare está lanzando una plataforma de “Pago por Rastreo”, que permitirá a los propietarios de sitios web establecer tarifas para que las empresas de IA puedan acceder a su contenido de forma legítima. Por ahora, esta opción está disponible solo para algunos medios de referencia, como The Atlantic, Stack Overflow o Quora, pero se espera su extensión progresiva.
Este modelo pretende restablecer un equilibrio ético y económico: si las empresas tecnológicas quieren utilizar contenido humano para entrenar sus modelos, deberán pagar por ello.
¿Qué supone esto para el futuro de Internet?
El anuncio llega en un momento clave. Cada vez más usuarios consultan directamente a chatbots como ChatGPT en lugar de visitar webs originales, lo que reduce el tráfico a los sitios de contenido y plantea dudas sobre la sostenibilidad del ecosistema digital tal y como lo conocemos.
Como ha señalado Prince: “La gente confía más en la IA en los últimos seis meses, lo que significa que no leen contenido original. Eso es una amenaza directa para los creadores.”
Un paso firme por la transparencia y los derechos digitales
Cloudflare no solo ofrece protección, también quiere facilitar la verificación de bots legítimos. Está trabajando con empresas de IA para que declaren su finalidad (entrenamiento, inferencia, búsqueda) y los propietarios web puedan decidir qué permitir o bloquear.
Con esta iniciativa, Cloudflare refuerza su posicionamiento como aliado de los creadores, defensores de la propiedad intelectual en la era de la inteligencia artificial. Y lanza una advertencia clara: la era del scraping sin consecuencias puede estar llegando a su fin.
vía: blog.cloudflare.com