La controversia sobre el uso de material protegido por derechos de autor para entrenar modelos de inteligencia artificial ha alcanzado un nuevo nivel con la reciente demanda contra Meta. Documentos judiciales revelan que la compañía de Mark Zuckerberg descargó al menos 81.7 terabytes de libros piratas para alimentar su modelo de lenguaje Llama, lo que ha generado un intenso debate sobre la legalidad y la ética de sus prácticas.
La demanda contra meta por libros piratas
Un grupo de autores, incluidos Sarah Silverman y Ta-Nehisi Coates, han presentado una demanda alegando que Meta utilizó de manera ilegal libros protegidos por derechos de autor para entrenar su IA. Según la documentación del caso, la compañía accedió a bases de datos como LibGen y Z-Library, conocidas por alojar contenido sin licencia.
Una comunicación interna de Meta señala que el uso de estos archivos piratas fue aprobado por el propio Zuckerberg. En el memo se menciona que, después de la “escalada a MZ” (las iniciales del CEO), el equipo de IA obtuvo la aprobación para utilizar el dataset de LibGen, a pesar de las advertencias de los ejecutivos sobre las posibles repercusiones legales.
El tamaño del supuesto robo de datos
El impacto de la supuesta infracción de derechos de autor es masivo. Se estima que Meta descargó 81.7 terabytes de contenido de bibliotecas clandestinas, lo que equivale a millones de libros y artículos. Dentro de este total, 35.7 terabytes provienen de Z-Library y LibGen, lo que resalta la magnitud del problema.
En los correos internos también se evidencia que empleados de Meta expresaron preocupación sobre la legalidad del proceso. Un ingeniero de investigación de la compañía escribió en un mensaje:
“Torrentear desde una laptop corporativa no se siente bien.”
A pesar de estas inquietudes, el uso de torrents para acceder a libros piratas continuó. Se tomaron medidas para ocultar la actividad, como evitar el uso de servidores de Facebook para las descargas y minimizar la “siembra” de archivos (el proceso de compartir contenido con otros usuarios).
El argumento de Meta: ¿Uso justo o infracción deliberada?
Meta ha argumentado que sus prácticas están protegidas bajo la doctrina del “fair use”, que permite el uso limitado de material con derechos de autor en ciertos contextos. La compañía sostiene que su IA transforma los textos originales y no reemplaza el contenido original.
Sin embargo, los demandantes afirman que esta defensa es insostenible debido a la magnitud de la infracción. Además, las evidencias sugieren que Meta intentó encubrir sus acciones, lo que podría debilitar su posición en el litigio.
Impacto en la industria de la IA y derechos de autor
Este caso podría sentar un precedente legal crucial para el futuro de la inteligencia artificial y el uso de contenido protegido por derechos de autor. Si los tribunales fallan en contra de Meta, podría obligar a la industria de la IA a replantear sus métodos de adquisición de datos y establecer nuevas regulaciones sobre el uso de contenido para el entrenamiento de modelos.
Por otro lado, una victoria de Meta podría allanar el camino para que otras compañías tecnológicas utilicen material con derechos de autor sin compensación para los creadores originales.
Conclusión
El caso de Meta y su presunto uso de libros piratas para entrenar su IA ha encendido un debate sobre los límites del “fair use” y la ética en el desarrollo de inteligencia artificial. Mientras los tribunales analizan las evidencias, el resultado de esta demanda podría redefinir la relación entre la tecnología y la propiedad intelectual en los próximos años.
¿Deberían las empresas tecnológicas pagar por el contenido que utilizan para entrenar sus IA? ¿O el “fair use” justifica este tipo de prácticas? Comparte tu opinión en los comentarios.