Principal alegação de copyright no processo do The Intercept contra a OpenAI segue adiante

(niemanlab.org)

1 pontos por GN⁺ 2024-12-01 | Ainda não há comentários. | Compartilhar no WhatsApp

Um tribunal federal de Nova York decidiu continuar analisando a alegação sob a DMCA de que a OpenAI removeu informações de gestão de direitos autorais ao incluir artigos do The Intercept nos dados de treinamento do ChatGPT
O juiz Jed Rakoff manteve apenas parte das alegações sob a DMCA e rejeitou a alegação de que a OpenAI distribuiu conscientemente cópias dos artigos após a remoção, bem como todas as alegações contra a Microsoft
O The Intercept se concentra não em violação comum de copyright, mas em violação da DMCA, mostrando uma via judicial que também pode ser usada por veículos digitais de notícias com pouca obra registrada no Escritório de Direitos Autorais
Alegações semelhantes sob a DMCA feitas por Raw Story e AlterNet foram rejeitadas no mesmo mês por outro juiz, mas uma petição inicial emendada pode ser aceita, então o rumo desses processos ainda está em aberto
Os autores pedem US$ 2.500 em indenização por cada caso de remoção de informações protegidas pela DMCA; se calculadas por artigo, as violações podem chegar a dezenas de milhares

A alegação sob a DMCA que sobreviveu no caso The Intercept

O juiz Jed Rakoff, de um tribunal federal de Nova York, decidiu que uma alegação central apresentada pelo The Intercept contra a OpenAI continuará a ser tratada em juízo
A questão restante é se a OpenAI removeu informações de gestão de direitos autorais ao incluir artigos do The Intercept no conjunto de dados de treinamento usado para construir o ChatGPT
A lei em questão é a Digital Millennium Copyright Act (DMCA), promulgada em 1998, que inclui dispositivos de proteção que proíbem a remoção de nome do autor, termos de uso e título de obras digitais
O tribunal não acolheu parte das outras alegações do The Intercept
- A alegação de que a OpenAI distribuiu conscientemente cópias dos artigos após a remoção das informações protegidas pela DMCA foi rejeitada
- Todas as alegações contra a Microsoft, que investiu bilhões de dólares na OpenAI, também foram rejeitadas
- A decisão com os fundamentos da rejeição deve ser divulgada nas próximas semanas

Matt Topic, advogado do The Intercept, avalia que a decisão permite que publishers digitais sem registros de copyright avancem com alegações sob a DMCA contra a OpenAI
Topic disse estar decepcionado com a exclusão das alegações relacionadas à Microsoft, mas avaliou positivamente a permanência da principal alegação sob a DMCA contra a OpenAI
Jason Deutrom, porta-voz da OpenAI, afirmou que os modelos da OpenAI são treinados com dados disponíveis publicamente e se baseiam em uso justo e princípios relacionados
O caso é um exemplo de publisher digital de notícias que colocou em primeiro plano violações da DMCA, e não infração de copyright, contra a OpenAI

Os processos do The New York Times, The New York Daily News e Mother Jones contra a OpenAI têm como foco alegações de infração de copyright
Processos por infração de copyright exigem que as obras envolvidas tenham sido previamente registradas no Escritório de Direitos Autorais dos EUA (USCO)
Muitos publishers digitais de notícias não registraram seus arquivos de artigos, e para vários veículos, incluindo o The Intercept, o custo e o procedimento de enviar ao USCO todas as obras publicadas na internet continuam sendo um obstáculo
Em agosto de 2024, o USCO acrescentou uma regra que permite a “sites de notícias” registrar artigos em lote
- Antes, era preciso enviar individualmente cada página de artigo de um site e pagar uma taxa para cada uma
- A nova regra citou preocupações com infrações não controladas de conteúdo jornalístico online e a necessidade de o registro de copyright se adaptar às mudanças tecnológicas
Para a maioria dos publishers digitais de notícias que considera medidas legais porque a OpenAI teria usado suas obras no treinamento do ChatGPT, essa mudança chegou tarde demais

No início do mesmo mês, outra juíza de um tribunal federal de Nova York rejeitou todas as alegações sob a DMCA apresentadas por Raw Story e AlterNet contra a OpenAI
A juíza Colleen MacMahon entendeu que o dano que os autores realmente buscavam reparar não estava na ausência de informações de gestão de conteúdo nos conjuntos de dados de treinamento, mas no fato de a OpenAI ter usado seus artigos sem compensação para desenvolver o ChatGPT
Ainda assim, o tribunal disse que poderia analisar uma petição inicial emendada que refletisse essas preocupações
Raw Story e AlterNet apresentaram uma petição inicial emendada pouco antes da decisão no caso The Intercept
- A petição emendada afirma que os réus poderiam ter mantido ou removido as informações de gestão de direitos autorais protegidas pela DMCA ao inserir obras jornalísticas nos conjuntos de treinamento, e escolheram removê-las
- Também afirma que a OpenAI treinou o ChatGPT para não reconhecer nem respeitar direitos autorais, para não informar aos usuários que as respostas são protegidas por direitos autorais de jornalistas e para não fornecer fonte ao usar obras de jornalistas humanos
Topic avalia que a petição emendada pode igualar ou até superar os argumentos que sobreviveram no caso The Intercept

The Intercept e Raw Story·AlterNet pedem US$ 2.500 em indenização por cada caso em que a OpenAI teria removido informações protegidas pela DMCA dos conjuntos de dados de treinamento
Se a indenização for calculada por artigo individual supostamente usado no treinamento do ChatGPT, o número de violações pode crescer rapidamente para dezenas de milhares
Atualmente, o caso The Intercept é o único processo de publisher de notícias não atrelado a infração de copyright que passou da fase de pedido de rejeição
Ainda é incerto se esta decisão levará outros veículos a entrarem com mais ações sob a DMCA
Com o passar do tempo, novos processos que questionem conjuntos de dados de treinamento usados pelo ChatGPT podem ficar vulneráveis a limitações de prazo prescricional