Palo a Meta: se bajó mediante Torrent docenas de millones de libros pirateados, para entrenar a su IA

Los emails hechos públicos por la acusación demuestran que Meta usó ficheros Torrent para descargar 81,7 TB con millones de libros provenientes de sitios webs piratas. El juicio por violación de copyright da un vuelco.
Meta está inmersa en un juicio por violación de copyright para entrenar a su inteligencia artificial Llama. Ayer se han hecho públicos varios emails que demuestran que Meta se descargó mediante BitTorrent y herramientas similares bases de datos completas de libros piratas, como LibGen, que se ofrecen en conocidas webs de piratería.
La acusación, una asociación de escritores cuyos libros han sido utilizados para entrenar a la inteligencia artificial de Meta sin su permiso (y sin pagarles), ha presentado estos emails como prueba de que Meta se descargó mediante ficheros Torrent docenas de millones de libros, usando técnicas para ocultar su identidad.
La gravedad de las pruebas van más allá de piratear libros, porque al usar ficheros Torrent, para descargar hay que compartir, así que puede ser acusada de participar en la distribución de contenido protegido por copyright.
La vena pirata de Meta para entrenar a su IA
La revelación de que Meta había usado ficheros Torrent para descargas millones de e-books pirateados se conoció el mes pasado, y la propia Meta reconoció que era cierto. Pero ha sido ayer cuando, gracias a unos emails enviados a la fiscalía, se conocen los datos exactos. Puedes consultar esos emails en este enlace de Ars Technica.
Según el documento, "se descargaron al menos 81,7 TB de datos de múltiples bibliotecas en la sombra a través del sitio Anna's Archive, incluidos al menos 35,7 terabytes de datos de Z-Library y LibGen. Meta también torrenteó previamente 80,6 terabytes de datos de LibGen".
Meta era consciente de lo que hacía. En los correos se puede leer desde empleados que se quejan por piratear libros, hasta consejos para descargar los torrents desde servidores que no fueran de Facebook, para evitar que pudieran rastrearlos a través de las semillas.
"Hacer torrents desde un portátil corporativo no me parece bien", escribe con sorna el ingeniero de investigación de Meta Nikolay Bashlykov en abrir de 2023, usando un emoji sonriente. En el mismo mensaje, indica que "estoy preocupado por el uso de direcciones IP de Meta para descargar a través de torrents contenido pirata".
Meta, por tanto, era consciente de que estaba pirateando libros, pero la operación se completó hasta descargar docenas de millones de ebooks protegidos por copyright.
La estrategia de los autores pasa por incidir en que Meta no solo pirateó libros, sino que los distribuyó mientras los descargaba a través de BitTorrent o similar.
La defensa de Meta, por su parte, sigue insistiendo en que la descarga de la base de datos de LibGen se hizo dentro de lo que considera "uso justo". Una forma muy peculiar de llamar a lo que es entrenar una inteligencia artificial para ganar dinero...
La defensa también ha declarado que "los demandantes no alegan un solo caso en el que cualquier parte de cualquier libro fue, de hecho, descargado por un tercero de Meta a través de Torrent, y mucho menos que los libros de los demandantes fueron de alguna manera distribuidos por Meta".
Puede que los autores no puedan demostrar que, exactamente sus libros, fueron compartidos por Meta, pero lo cierto es que, por la forma en que funciona el protocolo Torrent, para descargar tienes que compartir lo que estás descargando.
Un asunto muy turbio que demuestra que las grandes compañías tecnológicas no tienen problema en saltarse la ley y el copyright, para cumplir sus objetivos.
Y aunque queda demostrado que Meta descargó docenas de millones de libros protegidos por copyright de webs piratas, a través de ficheros Torrent, seguramente este juicio acabará como todos: pagando una indemnización millonaria, y a otra cosa. El dinero les sobra...

