Autores demandan a empresas de inteligencia artificial por entrenar modelos en libros pirateados

Los copiosos tesoros de material escrito, en su mayoría pirateado, utilizado para entrenar a la actual generación de modelos en grandes idiomas siempre estuvieron destinados a desafíos legales. el más interesante de los hasta ahora llegó a la vía de comediante Sarah Silverman y los autores Christopher Golden y Richard Kadrey, quienes se unieron en una demanda que criticaba a ChatGPT de OpenAI y LLaMA de Meta por recibir capacitación sobre materiales con derechos de autor
Los autores afirman que las empresas de tecnología utilizaron texto extraído de Library Genesis, Z-Library, Sci-Hub y otros repositorios en línea que albergan contenido en violación de las reglas de copyright. The Atlantic detalló recientemente más de 190.000 libros incluido en el conjunto de datos de Books3 que supuestamente se utilizó para entrenar el modelo LLaMA de Meta.