1 pontos por GN⁺ 2023-12-29 | 1 comentários | Compartilhar no WhatsApp

New York Times processa a OpenAI por direitos autorais

  • O New York Times entrou com uma ação por violação de direitos autorais contra a OpenAI e sua parceira Microsoft.
  • Foram apresentadas evidências de que sistemas baseados em GPT desenvolvidos pela OpenAI podem reproduzir artigos do New York Times.
  • Como as negociações não avançaram bem, o New York Times decidiu processar a OpenAI por questões de licenciamento.

O jornalismo custa caro

  • O New York Times tem altos custos, incluindo a realização de jornalismo investigativo importante por meio de repórteres de diversas áreas.
  • O jornal gera receita com um paywall robusto e restringe o uso de suas obras por meio de avisos de direitos autorais e termos de uso.
  • A ação afirma que as ferramentas desenvolvidas pela OpenAI estão prejudicando esse modelo de geração de receita.

Não é só sobre treinamento

  • Várias ações judiciais já foram movidas sobre o uso de material protegido por direitos autorais no treinamento de sistemas de IA.
  • O processo do New York Times mostra como materiais absorvidos durante o treinamento podem reaparecer durante o uso.
  • A ação inclui casos em que o GPT-4 reproduz artigos do New York Times quase literalmente.

Reputação e outros danos

  • A ação aponta que as “alucinações” da IA podem prejudicar a reputação do New York Times e afetar negativamente a saúde humana.
  • Em artigos do Wirecutter, de propriedade do New York Times, conteúdo protegido por direitos autorais também teria sido usado sem autorização e links de monetização teriam sido removidos.
  • O processo acusa a OpenAI e a Microsoft de violação de direitos autorais, da DMCA e de marca registrada, entre outras infrações.

Opinião do GN⁺:

  • Este artigo mostra bem os problemas que surgem quando o avanço da tecnologia de IA entra em conflito com estruturas legais existentes, como os direitos autorais.
  • A relação de tensão entre detentores de direitos autorais e desenvolvedores de IA pode desencadear debates jurídicos e éticos importantes sobre o futuro da IA.
  • O fato de um grande veículo de imprensa como o New York Times tomar medidas legais contra a tecnologia de IA pode se tornar um precedente importante para estabelecer regulações e diretrizes sobre como a IA gera e distribui conteúdo.

1 comentários

 
GN⁺ 2023-12-29
Opiniões do Hacker News
  • Questionamento sobre se raspar artigos do New York Times (NYT) para criar produtos se enquadra em uso justo

    • Levanta-se a dúvida sobre se criar um produto usando artigos do NYT obtidos legalmente por scraping, resumindo-os e reescrevendo-os para oferecer como serviço pago, se enquadra em uso justo.
    • Menciona-se a diferença em relação aos mecanismos de busca: enquanto eles não substituem o original e fornecem apenas referência, um produto de resumos pode ser usado no lugar de uma assinatura do NYT.
  • Perspectivas sobre o processo de direitos autorais do NYT

    • Argumenta-se que a próxima geração de LLMs (grandes modelos de linguagem) será treinada apenas com dados “sintéticos” sem direitos autorais, o que eliminaria problemas de violação.
    • Há a opinião de que os EUA não conseguirão impedir esse avanço tecnológico e que outros países sairão na frente.
    • Apresenta-se a visão de que, devido à evolução complexa dos modelos de IA e à falta de clareza sobre a origem dos dados, será difícil para a lei de direitos autorais acompanhar esse cenário.
  • Avaliação sobre a cópia de conteúdo do NYT por ChatGPT/Bing Copilot

    • Considera-se que casos em que ChatGPT e Bing Copilot copiam artigos do NYT literalmente não se enquadram em uso justo.
    • O processo sustenta que não se trata apenas de cópia simples, mas que a reprodução não autorizada de artigos para treinar LLMs também configura violação de direitos autorais.
    • Há a opinião de que o foco deveria estar na questão jurídica de saber se o modelo pode ser considerado “transformativo”.
  • Preocupações sobre “uso justo” levantadas no processo

    • Expressa-se preocupação com o risco de poucas empresas passarem a monopolizar o valor da internet.
    • Há a expectativa de que os tribunais estabeleçam regras para esse campo.
  • Link para documentos do processo de direitos autorais do NYT e resumo do conteúdo

    • É fornecido um link para documentos que mostram com clareza casos em que o ChatGPT cita material protegido por direitos autorais literalmente.
    • Levanta-se a questão de quanto um material protegido precisa ser transformado para que os direitos autorais deixem de se aplicar.
    • Discute-se a possibilidade de a OpenAI bloquear, pela interface web, o vazamento de material protegido por direitos autorais.
  • Crítica à percepção de desenvolvedores de que LLMs são semelhantes a humanos

    • Critica-se a visão de desenvolvedores de que LLMs usam artigos do NYT como material educativo da mesma forma que humanos.
    • Aponta-se que o fato de um LLM ser complexo não muda o fato de que conteúdo protegido por direitos autorais foi integrado ao código-fonte.
  • Expectativa de monetização por empresas de conteúdo

    • Empresas de conteúdo, incluindo o NYT, esperam cobrar pelo uso de seu conteúdo no treinamento de LLMs.
    • Menciona-se que Reddit, Discord e Twitter estão considerando ou já realizando a venda de conteúdo para treinamento de IA.
  • Argumento jurídico do NYT sobre o uso de LLMs

    • Analisa-se a alegação do NYT de que a forma como seu conteúdo é usado no treinamento de LLMs constitui violação de direitos autorais.
    • Compara-se a crítica à venda de acesso a LLMs por grandes empresas com uma postura mais tolerante em relação ao uso individual ou para pesquisa acadêmica.
  • Previsões sobre o uso futuro de LLMs

    • Argumenta-se que, no futuro, quando LLMs forem integrados a corpos mecânicos que interagem com o mundo físico, ler material protegido por direitos autorais poderá se tornar ilegal.
    • Apresenta-se a visão de que robôs não poderão reter na memória conteúdo protegido obtido ao assistir TV, ler livros de biblioteca ou pesquisar na internet.
  • Opinião de que LLMs deveriam se enquadrar em uso justo como “obra transformativa”

    • É expressa a opinião pessoal de que LLMs deveriam se enquadrar em uso justo por serem trabalhos transformativos.
    • Demonstra-se interesse em saber qual será a decisão do sistema jurídico sobre isso.