-
Principais desdobramentos do processo
- Recentemente, um juiz federal de Nova York decidiu que a principal alegação de violação de direitos autorais apresentada pelo The Intercept contra a OpenAI seguirá adiante no tribunal.
- O processo se baseia na alegação de que a OpenAI usou artigos do The Intercept em seu conjunto de dados de treinamento para construir o ChatGPT, removendo as informações de autoria.
- Isso pode configurar violação do Digital Millennium Copyright Act (DMCA), que torna ilegal remover de obras digitais o nome do autor, as condições de uso e o título.
-
Estratégia jurídica e contexto
- O The Intercept está abrindo uma nova estratégia jurídica em seu processo contra a OpenAI.
- A maioria das editoras de notícias digitais não registra seus arquivos de artigos no U.S. Copyright Office (USCO). Isso ocorre por causa do custo e da burocracia.
- O USCO alterou recentemente as regras para permitir que sites de notícias registrem artigos em lote, mas a mudança chegou tarde demais para muitas editoras que queriam tomar medidas legais contra a OpenAI.
-
Comparação com outros processos
- As alegações com base no DMCA feitas por Raw Story e AlterNet foram rejeitadas por outro juiz federal de Nova York.
- Eles afirmam que a OpenAI removeu informações protegidas pelo DMCA ao incluir trabalhos jornalísticos em seu conjunto de dados de treinamento e pedem US$ 2.500 em indenização por cada caso.
-
Perspectivas futuras
- Ainda não está claro se o processo do The Intercept dará a outras editoras coragem para considerar ações com base no DMCA.
- Novos processos podem ficar vulneráveis a prazos de prescrição, especialmente quando tentam citar o conjunto de dados de treinamento do ChatGPT.
- A Loevy & Loevy está restringindo suas alegações do DMCA a pontos específicos que de fato possam se sustentar no tribunal.
1 comentários
Comentários do Hacker News
A Disney possui muito IP e pode acabar ficando em posição de operar LLMs de forma monopolista. Isso reforçaria a estrutura de monopólio já existente
A lei de copyright parece defasada e desnecessariamente rígida
Fico me perguntando se existe alguma forma de verificar se a OpenAI usou o meu blog
Se for ilegal usar obras com copyright no treinamento, fico pensando se seria possível fazer a LLM A resumir um artigo e usar isso para treinar a LLM B
Não está claro se a decisão no caso da Intercept fará outras editoras considerarem ações com base na DMCA
Existem regulações e pode haver violação de copyright, mas também deveríamos nos preocupar com a possibilidade de outros governos, principalmente a China, se aproveitarem disso para avançar
A alegação sobre remoção de metadados sob a 17 USC 1202 segue em andamento
A ideia de que "um ativo digital é exclusivamente meu" precisa desaparecer
Pode surgir uma prática de adicionar um toque final de "feito por humano" a obras de IA
Proposta: cobrar um imposto de 10% sobre acordos de copyright, com metade indo para criadores do passado e metade para a cultura criativa atual