Escritores demandaron a ChatGPT por “ingerir” sus libros sin permiso

El auge de las inteligencias artificiales vinculadas a la “creación” (nótense las comillas) ha venido preocupando a artistas de las letras y la ilustración alrededor del planeta, que temen ser reemplazados por el solo hecho de que las empresas se ahorren un puñado de dólares. Sin embargo, así como Al Capone cayó por no pagar impuestos, otros crímenes organizados podrían tener su propio talón de Aquiles.

OpenAI, compañía propietaria de la popular herramienta de conversación y “elaboración” de textos ChatGPT, fue demandada por dos escritores norteamericanos por entender que el bot de chateo “ingirió” (en este caso las comillas son por la cita textual) sus obras.

La semana pasada, la novelista canadiense Mona Awad y su colega estadounidense Paul Tremblay iniciaron una demanda colectiva en la corte federal de San Francisco, informó The Guardian. Entienden que OpenAI entrenó a su herramienta con sus libros sin contar con la autorización de ambos, lo que iría en contra de las leyes de copyright.

Para responder a los usuarios con textos que se parezcan a respuestas humanas, ChatGPT se entrena con información disponible en internet en forma libre. Sin embargo, para los escritores habría evidencia de la mencionada ingestión de sus libros por parte del bot, ya que fue capaz de generar “resúmenes muy precisos” de cada uno de ellos, según el texto de la demanda, que incluye varios ejemplos. Agregan que OpenAI se beneficia en forma injusta de “escritos e ideas robadas” y piden un resarcimiento económico en representación de todos los autores radicados en Estados Unidos cuya obra supuestamente se usó para entrenar al chatbot.

Joseph Saveri y Matthew Butterick, abogados de los demandantes, explicaron al citado medio británico que los libros son un material ideal para el entrenamiento de estos nuevos modelos de lenguaje, ya que suelen tener “prosa extensa, bien editada y de alta calidad”, que los convierte en “test de referencia perfecto para el almacenamiento de ideas de nuestra especie”. Y pese a que los autores con trabajos protegidos por derechos de autor ya tienen un respaldo legal, se enfrentan a compañías “que se comportan como si esas leyes no se aplicaran a ellos”.

Un aspecto problemático para los autores es demostrar que sufrieron pérdidas económicas debido al entrenamiento ChatGPT con material con derechos de autor, incluso si dicho entrenamiento pudiera comprobarse. Esto último es complejo, ya que la herramienta pudo haber “ingerido”, por ejemplo, discusiones en foros de internet libres en los que usuarios hablaran de los libros. A esto se le suma el secretismo de la compañía acerca de la información utilizada para mejorar a su inteligencia artificial. Por el tamaño del conjunto de datos, que incluiría casi 300.000 libros, los abogados sospechan que provendrían de bibliotecas ilegales obtenidas en archivos torrent.

Los abogados están convencidos de que eventualmente los diferentes modelos de inteligencia artificial se verán obligados a aceptar las reglas de los derechos de autor, como ocurrió con la música digital o el audiovisual, y solamente podrán basarse en información de la que cuenten con licencia.

Desde el lanzamiento de ChatGPT en noviembre del año pasado, la industria editorial entró en modo alerta debido al daño potencial de esta clase de tecnologías. El pasado mes de junio, la Society of Authors, el sindicato de escritores de Reino Unido, publicó una serie de pasos para que sus integrantes se protegieran y protegieran su obra. Nicola Solomon, director ejecutivo, dijo que la organización recibió de buena manera la demanda de los autores, luego de meses de preocupación acerca de posibles copias masivas de libros para entrenar modelos de lenguaje.