1 pontos por GN⁺ 2024-12-01 | 1 comentários | Compartilhar no WhatsApp
  • Principais desdobramentos do processo

    • Recentemente, um juiz federal de Nova York decidiu que a principal alegação de violação de direitos autorais apresentada pelo The Intercept contra a OpenAI seguirá adiante no tribunal.
    • O processo se baseia na alegação de que a OpenAI usou artigos do The Intercept em seu conjunto de dados de treinamento para construir o ChatGPT, removendo as informações de autoria.
    • Isso pode configurar violação do Digital Millennium Copyright Act (DMCA), que torna ilegal remover de obras digitais o nome do autor, as condições de uso e o título.
  • Estratégia jurídica e contexto

    • O The Intercept está abrindo uma nova estratégia jurídica em seu processo contra a OpenAI.
    • A maioria das editoras de notícias digitais não registra seus arquivos de artigos no U.S. Copyright Office (USCO). Isso ocorre por causa do custo e da burocracia.
    • O USCO alterou recentemente as regras para permitir que sites de notícias registrem artigos em lote, mas a mudança chegou tarde demais para muitas editoras que queriam tomar medidas legais contra a OpenAI.
  • Comparação com outros processos

    • As alegações com base no DMCA feitas por Raw Story e AlterNet foram rejeitadas por outro juiz federal de Nova York.
    • Eles afirmam que a OpenAI removeu informações protegidas pelo DMCA ao incluir trabalhos jornalísticos em seu conjunto de dados de treinamento e pedem US$ 2.500 em indenização por cada caso.
  • Perspectivas futuras

    • Ainda não está claro se o processo do The Intercept dará a outras editoras coragem para considerar ações com base no DMCA.
    • Novos processos podem ficar vulneráveis a prazos de prescrição, especialmente quando tentam citar o conjunto de dados de treinamento do ChatGPT.
    • A Loevy & Loevy está restringindo suas alegações do DMCA a pontos específicos que de fato possam se sustentar no tribunal.

1 comentários

 
GN⁺ 2024-12-01
Comentários do Hacker News
  • A Disney possui muito IP e pode acabar ficando em posição de operar LLMs de forma monopolista. Isso reforçaria a estrutura de monopólio já existente

    • Esse não era o objetivo original do copyright. A Disney teve sucesso usando obras de domínio público
    • O copyright só é possível porque o público sustenta a infraestrutura. Ideias e imagens podem ser copiadas infinitamente
    • O copyright deveria retornar à sociedade ao passar para o domínio público. Porém, hoje a situação é de empresas reivindicando direitos monopolistas
  • A lei de copyright parece defasada e desnecessariamente rígida

    • É excessivo e insustentável que grandes empresas gerem lucros enormes por tanto tempo por meio do copyright
    • Mesmo com novas obras sendo criadas o tempo todo, a saturação de mídia e o marketing fazem certas obras parecerem mais valiosas
    • O copyright deveria expirar depois que o custo do investimento fosse recuperado
    • Manter copyright indefinidamente beneficia principalmente advogados e órgãos de fiscalização, sem gerar valor significativo para a sociedade
    • É necessário equilíbrio entre proteger criadores e promover inovação
  • Fico me perguntando se existe alguma forma de verificar se a OpenAI usou o meu blog

    • Se houver um acordo de US$ 2.500 por artigo, eu poderia receber o valor de um carro usado
  • Se for ilegal usar obras com copyright no treinamento, fico pensando se seria possível fazer a LLM A resumir um artigo e usar isso para treinar a LLM B

    • A LLM A poderia ser treinada com obras de domínio público
  • Não está claro se a decisão no caso da Intercept fará outras editoras considerarem ações com base na DMCA

    • Novos processos contra a OpenAI podem ficar vulneráveis ao prazo prescricional
    • Editoras como a Intercept estão pedindo indenização de US$ 2.500 contra a OpenAI
    • Se houver milhares de violações, isso pode virar dezenas de milhões de dólares em indenizações
  • Existem regulações e pode haver violação de copyright, mas também deveríamos nos preocupar com a possibilidade de outros governos, principalmente a China, se aproveitarem disso para avançar

  • A alegação sobre remoção de metadados sob a 17 USC 1202 segue em andamento

    • Isso não é a "violação central de copyright"
  • A ideia de que "um ativo digital é exclusivamente meu" precisa desaparecer

    • Não se deve bloquear as vantagens da internet digital e é preciso evitar o problema da saturação de dados
    • Devemos nos opor à escassez digital
  • Pode surgir uma prática de adicionar um toque final de "feito por humano" a obras de IA

    • Isso pode acrescentar mais um peso financeiro em um inverno da IA
  • Proposta: cobrar um imposto de 10% sobre acordos de copyright, com metade indo para criadores do passado e metade para a cultura criativa atual