La controversia en torno a la inteligencia artificial (IA) y el uso de datos protegidos por derechos de autor ha alcanzado un nuevo nivel con el caso Kadrey contra Meta. La empresa de Mark Zuckerberg enfrenta una demanda que la acusa de haber utilizado material con copyright para entrenar sus modelos de IA, una práctica que no solo es cuestionable desde el punto de vista ético, sino también ilegal. A medida que emergen nuevas pruebas, el escándalo crece y pone en jaque la credibilidad de la compañía en materia de propiedad intelectual.
Las evidencias: Correos internos que lo confirman
Documentos judiciales han revelado correos electrónicos internos en los que empleados de Meta discuten la recolección masiva de datos mediante torrents, incluyendo libros protegidos por derechos de autor. En octubre de 2022, la empleada Melanie Kambadur manifestó su preocupación respecto a la legalidad de esta práctica. Meses después, en abril de 2023, Nikolay Bashlykov, responsable de la recolección de datos, hizo un comentario revelador: «Descargar con torrents desde un portátil de la empresa no parece buena idea».
Con el paso del tiempo, la discusión en Meta pasó de bromas a advertencias más serias. En septiembre de 2023, Bashlykov alertó que el uso de torrents podía implicar actuar como «semillas» para otros usuarios, lo que podría ser legalmente problemático. Frank Zhang, otro investigador de la compañía, sugirió medidas para evitar que se rastreara a los empleados de Meta que realizaban estas descargas. Todo apunta a que la empresa sabía del riesgo legal que corría, pero decidió proceder de todos modos.
La magnitud del saqueo digital
Según los documentos presentados en el caso, Meta descargó al menos 81,7 terabytes de datos, de los cuales 35,7 TB provinieron de sitios como Z-Library y LibGen, plataformas conocidas por distribuir libros sin la autorización de sus autores. Para poner esta cifra en perspectiva, esta cantidad de datos equivale a millones de libros pirateados. La dimensión de esta operación ha sorprendido incluso a expertos legales, quienes han señalado que en casos anteriores, descargas de datos significativamente menores han derivado en investigaciones criminales.
El hecho de que Meta intentara ocultar sus huellas al descargar estos libros sugiere que la empresa era plenamente consciente de la ilegalidad de sus acciones. Como indicó Zhang en un mensaje interno, la empresa evitó utilizar sus propios servidores para descargar estos datos con el fin de reducir el riesgo de ser rastreada.
Meta defiende su accionar bajo el «uso justo»
A pesar de las contundentes pruebas, Meta ha solicitado que se desestimen los cargos en su contra, argumentando que no hay evidencias claras de que sus empleados hayan descargado libros protegidos por derechos de autor mediante torrents. La empresa se ampara en el concepto del «uso justo» (fair use), una doctrina del derecho anglosajón que permite el uso limitado de material protegido sin necesidad de permiso.
Sin embargo, los demandantes argumentan que el «seeding» (compartición de archivos en torrents) implica una distribución activa de material con copyright, lo que podría fortalecer las acusaciones de violación de derechos de autor. La cuestión central es si la utilización de este material para entrenar modelos de IA constituye realmente un «uso justo» o si Meta ha sobrepasado los límites legales.
Una práctica común en la industria de la IA
Meta no es la única empresa en la industria de la IA que ha sido acusada de este tipo de prácticas. Google y OpenAI también han estado en el ojo del huracán por el uso de textos protegidos para entrenar sus modelos. OpenAI, por ejemplo, fue criticada por utilizar millones de documentos con copyright para desarrollar ChatGPT. La startup Perplexity también generó controversia al eludir muros de pago en internet para acceder a contenido restringido y alimentar su IA.
El problema subyacente es que el saqueo digital de datos protegidos se está normalizando en la industria de la inteligencia artificial. A pesar de las demandas en curso, muchas empresas continúan con estas prácticas sin enfrentar consecuencias inmediatas, lo que refuerza la sensación de impunidad en el sector.
Implicaciones legales y el futuro del caso contra Meta
El caso Kadrey contra Meta podría marcar un precedente legal en el uso de datos con copyright para entrenar modelos de IA. Si los tribunales fallan en contra de la empresa, otras compañías de tecnología podrían enfrentar demandas similares, lo que podría cambiar la forma en que se desarrollan los modelos de IA en el futuro.
Por otro lado, si Meta logra defender su accionar bajo la doctrina del «uso justo», podría sentarse un peligroso precedente que permita a otras empresas tecnológicas seguir explotando contenido protegido sin consecuencias legales.
A día de hoy, Meta no ha emitido una respuesta oficial ante estas nuevas revelaciones, aunque ha indicado que planea «aclarar el registro y desacreditar esta alegación sin mérito» durante el juicio sumario. Resta por ver si la compañía podrá esquivar las consecuencias de sus acciones o si enfrentará sanciones legales por su presunta piratería masiva.
El caso contra Meta pone en evidencia los límites difusos entre el avance tecnológico y el respeto a la propiedad intelectual. La IA generativa ha revolucionado el mundo digital, pero su desarrollo ha estado plagado de cuestionamientos éticos y legales. La comunidad internacional deberá decidir si el «uso justo» justifica la apropiación de contenidos protegidos o si es necesario reforzar las regulaciones para proteger los derechos de autores y creadores.
En un mundo cada vez más digitalizado, el equilibrio entre innovación y respeto por la propiedad intelectual será clave para el futuro de la tecnología.