Cloudflare combate a la IA que roba contenido protegido por copyright confundiéndola con datos irrelevantes... creados con IA

Imagen generada con IA

El laberinto de la IA es una nueva herramienta de Cloudflare que confunde a los bots de IA que roban contenido sin pedir permiso. Su objetivo es que pierdan el tiempo.

La empresa de seguridad Cloudflare se ha cansado de bloquear a los bots de IA que intentan colarse en las webs para robar contenido sin pedir permiso, y entrenar modelos de lenguaje. En su lugar va a meter a estos bots en un laberinto generado por IA, en donde podrán quedarse con todo el contenido irrelevante que quieran.

La empresa Cloudflare protege las webs y los servicios de sus clientes del espionaje de LaLiga para buscar listas IPTV piratas, por eso a Javier Tebas no puede ni verla. También frena ataques DDoS, malware, y a los bots que recopilan datos para entrenar a la inteligencia artificial.

La mayoría de las compañías de IA han decidido que la ley de derechos de autor, o la ley de propiedad de las webs, no va con ellas, así que se han lanzado a robar contenido y piratear libros, arte o música, entre otras cosas.

Así funciona el Laberinto IA de Cloudflare

Según explica la propia compañía de seguridad, su red recibe 50.000 millones de peticiones de bots al día, para robar contenido o espiar sin permiso, además de ocupar el 1% del tráfico.

Hasta ahora los bloqueaba, pero los bots detectan que los bloquean y prueban otros métodos para colarse, "llevando a una carrera armamentística sin fin", asegura en su blog.

Así que en lugar de bloquear, Cloudflare ha decidido aplicar otro enfoque: confundir y hacer perder el tiempo a los bots de IA, al mismo tiempo que consumen recursos de los servidores que los envían. De esta forma, sus creadores perderán tiempo y dinero.

Esta compañía de seguridad usa la inteligencia artificial generativa Workers AI, que genera contenido irrelevante que asocia a una web. Es contenido científico, neutro y conocido, que no va a aportar nada al entrenamiento de la IA, pero no es inventando, porque no quieren contribuir a la desinformación y las fake news de Internet.

Cuando un bot intenta robar datos sin permiso, es enviado a este Laberinto IA, como lo han llamado, en donde se le ofrece este contenido irrelevante, que cambiar continuamente gracias a que lo genera otra IA.

El bot perderá tiempo y recursos recopilando estos datos, que en realidad no sirven para nada. Y como van cambiando, no se da cuenta de la trampa, porque el bot no analiza la calidad del contenido, solo recopila todo lo que encuentra.

Este contenido es invisible para los humanos y los motores de búsqueda, para que no "contamine" Internet.

Confundir a los bots de IA que roban contenido sin pedir permiso, para entrenar a los modelos de lenguaje, es una idea inteligente. Las empresas de inteligencia artificial buscan ganar dinero, así que es justo que paguen, o al menos pidan permiso, para recopilar datos para el entrenamiento.

El Laberinto IA de Cloudflare está disponible para todos los clientes, incluso los que usan una cuenta gratuita. Veremos si los bots consiguen superarlo...

Otros artículos interesantes:

Más información sobre: