1 pontos por GN⁺ 2024-12-01 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Um tribunal federal de Nova York decidiu continuar analisando a alegação sob a DMCA de que a OpenAI removeu informações de gestão de direitos autorais ao incluir artigos do The Intercept nos dados de treinamento do ChatGPT
  • O juiz Jed Rakoff manteve apenas parte das alegações sob a DMCA e rejeitou a alegação de que a OpenAI distribuiu conscientemente cópias dos artigos após a remoção, bem como todas as alegações contra a Microsoft
  • O The Intercept se concentra não em violação comum de copyright, mas em violação da DMCA, mostrando uma via judicial que também pode ser usada por veículos digitais de notícias com pouca obra registrada no Escritório de Direitos Autorais
  • Alegações semelhantes sob a DMCA feitas por Raw Story e AlterNet foram rejeitadas no mesmo mês por outro juiz, mas uma petição inicial emendada pode ser aceita, então o rumo desses processos ainda está em aberto
  • Os autores pedem US$ 2.500 em indenização por cada caso de remoção de informações protegidas pela DMCA; se calculadas por artigo, as violações podem chegar a dezenas de milhares

A alegação sob a DMCA que sobreviveu no caso The Intercept

  • O juiz Jed Rakoff, de um tribunal federal de Nova York, decidiu que uma alegação central apresentada pelo The Intercept contra a OpenAI continuará a ser tratada em juízo
  • A questão restante é se a OpenAI removeu informações de gestão de direitos autorais ao incluir artigos do The Intercept no conjunto de dados de treinamento usado para construir o ChatGPT
  • A lei em questão é a Digital Millennium Copyright Act (DMCA), promulgada em 1998, que inclui dispositivos de proteção que proíbem a remoção de nome do autor, termos de uso e título de obras digitais
  • O tribunal não acolheu parte das outras alegações do The Intercept
    • A alegação de que a OpenAI distribuiu conscientemente cópias dos artigos após a remoção das informações protegidas pela DMCA foi rejeitada
    • Todas as alegações contra a Microsoft, que investiu bilhões de dólares na OpenAI, também foram rejeitadas
    • A decisão com os fundamentos da rejeição deve ser divulgada nas próximas semanas

Posições das partes e estratégia do processo

  • Matt Topic, advogado do The Intercept, avalia que a decisão permite que publishers digitais sem registros de copyright avancem com alegações sob a DMCA contra a OpenAI
  • Topic disse estar decepcionado com a exclusão das alegações relacionadas à Microsoft, mas avaliou positivamente a permanência da principal alegação sob a DMCA contra a OpenAI
  • Jason Deutrom, porta-voz da OpenAI, afirmou que os modelos da OpenAI são treinados com dados disponíveis publicamente e se baseiam em uso justo e princípios relacionados
  • O caso é um exemplo de publisher digital de notícias que colocou em primeiro plano violações da DMCA, e não infração de copyright, contra a OpenAI

Peso do registro de copyright e mudança nas regras do USCO

  • Os processos do The New York Times, The New York Daily News e Mother Jones contra a OpenAI têm como foco alegações de infração de copyright
  • Processos por infração de copyright exigem que as obras envolvidas tenham sido previamente registradas no Escritório de Direitos Autorais dos EUA (USCO)
  • Muitos publishers digitais de notícias não registraram seus arquivos de artigos, e para vários veículos, incluindo o The Intercept, o custo e o procedimento de enviar ao USCO todas as obras publicadas na internet continuam sendo um obstáculo
  • Em agosto de 2024, o USCO acrescentou uma regra que permite a “sites de notícias” registrar artigos em lote
    • Antes, era preciso enviar individualmente cada página de artigo de um site e pagar uma taxa para cada uma
    • A nova regra citou preocupações com infrações não controladas de conteúdo jornalístico online e a necessidade de o registro de copyright se adaptar às mudanças tecnológicas
  • Para a maioria dos publishers digitais de notícias que considera medidas legais porque a OpenAI teria usado suas obras no treinamento do ChatGPT, essa mudança chegou tarde demais

Um rumo diferente nos casos Raw Story e AlterNet

  • No início do mesmo mês, outra juíza de um tribunal federal de Nova York rejeitou todas as alegações sob a DMCA apresentadas por Raw Story e AlterNet contra a OpenAI
  • A juíza Colleen MacMahon entendeu que o dano que os autores realmente buscavam reparar não estava na ausência de informações de gestão de conteúdo nos conjuntos de dados de treinamento, mas no fato de a OpenAI ter usado seus artigos sem compensação para desenvolver o ChatGPT
  • Ainda assim, o tribunal disse que poderia analisar uma petição inicial emendada que refletisse essas preocupações
  • Raw Story e AlterNet apresentaram uma petição inicial emendada pouco antes da decisão no caso The Intercept
    • A petição emendada afirma que os réus poderiam ter mantido ou removido as informações de gestão de direitos autorais protegidas pela DMCA ao inserir obras jornalísticas nos conjuntos de treinamento, e escolheram removê-las
    • Também afirma que a OpenAI treinou o ChatGPT para não reconhecer nem respeitar direitos autorais, para não informar aos usuários que as respostas são protegidas por direitos autorais de jornalistas e para não fornecer fonte ao usar obras de jornalistas humanos
  • Topic avalia que a petição emendada pode igualar ou até superar os argumentos que sobreviveram no caso The Intercept

Valor das indenizações e opções para outros veículos

  • The Intercept e Raw Story·AlterNet pedem US$ 2.500 em indenização por cada caso em que a OpenAI teria removido informações protegidas pela DMCA dos conjuntos de dados de treinamento
  • Se a indenização for calculada por artigo individual supostamente usado no treinamento do ChatGPT, o número de violações pode crescer rapidamente para dezenas de milhares
  • Atualmente, o caso The Intercept é o único processo de publisher de notícias não atrelado a infração de copyright que passou da fase de pedido de rejeição
  • Ainda é incerto se esta decisão levará outros veículos a entrarem com mais ações sob a DMCA
  • Com o passar do tempo, novos processos que questionem conjuntos de dados de treinamento usados pelo ChatGPT podem ficar vulneráveis a limitações de prazo prescricional

Ainda não há comentários.

Ainda não há comentários.