New York Times processa OpenAI e Microsoft por suposta violação de direitos autorais

(theverge.com)

3 pontos por GN⁺ 2023-12-28 | 2 comentários | Compartilhar no WhatsApp

O New York Times processou a OpenAI e a Microsoft por suposta violação de direitos autorais
Alega que essas empresas copiaram milhões de artigos do New York Times para treinar modelos de linguagem que alimentam o ChatGPT e o Copilot
Diz que isso prejudicou a relação do New York Times com seus leitores e reduziu receitas de assinaturas, licenciamento, publicidade e parcerias

Alegações da ação

Segundo a ação, esses modelos de IA citam diretamente o conteúdo do New York Times, fazem resumos e imitam seu estilo de escrita, ameaçando o jornalismo de alta qualidade
O New York Times afirma que tentou negociar por meses, mas não conseguiu chegar a uma solução
Um porta-voz da OpenAI afirmou que a empresa está trabalhando para que criadores de conteúdo possam se beneficiar da tecnologia de IA e de novos modelos de receita

Notícias relacionadas

O New York Times bloqueou o rastreador web da OpenAI para impedir que ele continue coletando conteúdo do site
Outros veículos de notícias, como BBC, CNN e Reuters, também bloquearam o rastreador web da OpenAI
Em contraste, a Axel Springer firmou um acordo com a OpenAI para permitir que o ChatGPT use diretamente informações da Politico e da Business Insider

Opinião do GN⁺

Este caso reflete uma questão contemporânea em que o avanço da tecnologia de IA entra em choque com os direitos autorais.
A ação por violação de direitos autorais pode desencadear uma importante discussão jurídica e ética sobre como a IA deve utilizar criações humanas.
O fato de um grande veículo de notícias como o New York Times enfrentar empresas de IA pode representar um ponto de inflexão significativo para o futuro da tecnologia de IA e para a proteção dos direitos dos criadores de conteúdo.

2 comentários

xguru 2023-12-29

De acordo com outra reportagem, a petição exige a exclusão de todas as instâncias de GPT treinadas com materiais do New York Times e a destruição dos conjuntos de dados usados no treinamento. Também solicita uma liminar permanente para impedir atos semelhantes no futuro.
Além disso, inclui a exigência de um valor enorme em custos. "danos legais, danos compensatórios, restituição, danos punitivos e toda e qualquer outra medida cabível permitida por lei ou equidade"

GN⁺ 2023-12-28

Opiniões do Hacker News

Posição de apoio ao New York Times (NYT)
- Parece que organizações criativas estão mais uma vez ficando para trás na concorrência, assim como aconteceu no surgimento dos mecanismos de busca modernos.
- Não condeno a decisão inicial da OpenAI de treinar modelos sem acordos de licenciamento. Se não tivesse feito isso, a revolução da IA talvez nem tivesse acontecido.
- Mas agora a OpenAI precisa reconhecer o que deve aos criadores de conteúdo e corrigir isso. Caso contrário, pode sofrer perdas maiores e abrir espaço para concorrentes.
Sentimentos conflitantes sobre LLMs que consomem conteúdo protegido por direitos autorais e o reproduzem em algo novo
- Como desenvolvedor de software e autor, considero o avanço dos LLMs interessante, mas me preocupo com o uso de obras por LLMs.
- Hoje, os LLMs se parecem com sites inferiores que reescrevem conteúdo sem pesquisa original. Isso pode ser tecnicamente legal, mas é um comportamento parasitário que não agrega valor.
- Para especialistas, os erros e a falta de citações dos LLMs são um problema; para o público em geral, eles provavelmente serão usados para gerar conteúdo de baixo esforço voltado a SEO, o que pode levar à piora da qualidade dos próprios LLMs.
Esperança de ampliação do uso justo para treinamento de IA
- O uso justo para treinamento de IA é mais importante para o futuro da humanidade do que um único veículo de mídia.
- Mesmo que o NYT desapareça, há muitos veículos que poderiam substituí-lo, mas se a IA for prejudicada logo no início por disputas de propriedade intelectual (PI), isso pode atrapalhar avanços importantes.
Argumento fraco sobre imitação do estilo do New York Times e perspectiva negativa para a OpenAI
- Reproduzir diretamente o conteúdo do New York Times é desfavorável para a OpenAI.
- É difícil remover conteúdo específico de um LLM, o que sugere que a vida útil dos LLMs será curta.
Bloqueios baseados em infração de direitos autorais contra LLMs não promovem o progresso da ciência e das artes úteis
- Os LLMs precisam de regulação, mas de outro tipo de regulação, não baseada em direitos autorais.
- A ideia inicial mais aberta da OpenAI era boa, mas agora é necessária intervenção pública.
Crítica à possibilidade de uma empresa monopolizar toda a produção humana
- Esse tipo de conduta é, no mínimo, descarada e errada, e talvez vergonhosa.
- Como há vítimas demais, a OpenAI pode contar com a inviabilidade prática de ações judiciais e com a possibilidade de os tribunais decidirem previamente não indenizar os prejudicados.
Acesso livre a conteúdo publicado na internet e legitimidade do uso de dados por máquinas
- Se humanos podem acessar um conteúdo, as máquinas também deveriam poder acessá-lo.
- As máquinas podem assumir tarefas que os humanos fazem, liberando tempo para atividades mais interessantes.
Comportamento parasitário dos LLMs e comparação com trolls de patentes
- Os LLMs aproveitam padrões linguísticos de corpora de texto que os criadores não estavam usando para treinar modelos.
- Isso não beneficia a sociedade e só favorece os trolls. Não há motivo para os tribunais imporem isso.
Menção ao processo movido pelo New York Times contra a OpenAI e a Microsoft
- O New York Times alega que suas milhões de matérias foram copiadas e usadas para construir modelos de IA.