CNNE 1536163 - gettyimages-1244586844-20231227134844692

(CNN) – El diario The New York Times ha demandado a OpenAI y Microsoft por infracción de derechos de autor, alegando que la tecnología de inteligencia artificial de las empresas copió ilegalmente millones de artículos del periódico para entrenar a ChatGPT y otros servicios para proporcionar información a las personas, tecnología que ahora compite con la publicación.

La denuncia es la más reciente de una serie de demandas que buscan limitar el uso del supuesto scraping (raspado) de amplias franjas de contenido de Internet (sin compensación) para entrenar los llamados grandes modelos de inteligencia artificial de lenguaje. Los actores, escritores, periodistas y otros tipos creativos que publican sus trabajos en Internet temen que la IA aprenda de su material y proporcione chatbots competitivos y otras fuentes de información sin una compensación adecuada.

Pero la demanda del diario The New York Times es la primera entre los principales editores de noticias que se enfrenta a OpenAI y Microsoft, las marcas de IA más reconocibles.

En una denuncia presentada este miércoles, el diario dijo que el “uso ilegal del trabajo del Times por parte de Microsoft y OpenAI para crear productos de inteligencia artificial que compitan con él amenaza la capacidad del Times para brindar ese servicio”.

El documento señaló que OpenAI y Microsoft utilizaron otras fuentes en su “copia a gran escala”, pero “le dieron al Times un énfasis particular en el contenido” buscando “aprovechar la inversión masiva del Times en su periodismo usándolo para crear productos sustitutos sin permiso o pago”.

Microsoft y OpenAI no respondieron de inmediato a una solicitud de comentarios sobre la demanda.

El diario, en su denuncia, dijo que se opuso cuando descubrió hace meses que su trabajo se había utilizado para entrenar los grandes modelos lingüísticos de las empresas. A partir de abril, el Times dijo que comenzó a negociar con OpenAI y Microsoft para recibir una compensación justa y establecer los términos de un acuerdo.

Pero el Times alega que no ha podido llegar a una resolución con las empresas. Microsoft y OpenAI afirman que las obras del Times se consideran “uso justo”, lo que les da la posibilidad de utilizar material protegido por derechos de autor con un “propósito transformador”, afirma la denuncia.

“No hay nada ‘transformador’ en utilizar el contenido del Times sin pago para crear productos que sustituyan al Times y le roben audiencia”, dijo el diario en su denuncia. “Debido a que los resultados de los modelos GenAI de los demandados compiten con los insumos utilizados para entrenarlos y los imitan estrechamente, copiar el Times para ese propósito no es un uso legítimo”.

El periódico se encuentra entre varias salas de redacción líderes, incluida CNN, que a principios de este año agregaron un código a sus sitios web que impide que el rastreador web de OpenAI, GPTBot, escanee sus plataformas en busca de contenido.

El Times afirma que debido a que las herramientas de IA han sido entrenadas con su contenido, pueden “generar resultados que reciten el contenido del Times palabra por palabra, lo resuma detalladamente e imite su estilo expresivo, como lo demuestran decenas de ejemplos… Estas herramientas también atribuyen erróneamente información falsa al periódico”, afirma la denuncia.

El medio de comunicación también alega que el motor de búsqueda Bing de Microsoft, que fue actualizado a principios de este año con la tecnología OpenAI, “copia y clasifica” el contenido del Times para producir respuestas más largas y detalladas que los motores de búsqueda tradicionales.

“Al proporcionar contenido del Times sin el permiso o autorización del Times, las herramientas de los demandados socavan y dañan la relación del Times con sus lectores y privan al Times de suscripciones, licencias, publicidad e ingresos de afiliados”, afirma la demanda.

La vicepresidenta ejecutiva y asesora general del diario The New York Times, Diane Brayton, dijo al personal del medio en un memorando el miércoles por la mañana que “reconocemos el potencial de [la IA generativa] para el público y el periodismo”.

“Pero al mismo tiempo, creemos que el éxito de GenAI y las empresas que lo desarrollan no tiene por qué venir a expensas de las instituciones periodísticas”, según el memorando, al que tuvo acceso CNN. “El uso de nuestro trabajo para crear herramientas GenAI debe contar con un permiso y un acuerdo que refleje el valor justo de ese trabajo, como lo establece la ley”.

Con su demanda, el periódico busca daños monetarios no especificados, así como una orden judicial permanente que impediría a Microsoft y OpenAI continuar con la supuesta infracción. El Times también busca la “destrucción” de GPT y cualquier otro modelo de IA o conjunto de entrenamiento que incorpore sus contenidos.