3 pontos por GN⁺ 2023-12-28 | 2 comentários | Compartilhar no WhatsApp
  • O New York Times processou a OpenAI e a Microsoft por suposta violação de direitos autorais
  • Alega que essas empresas copiaram milhões de artigos do New York Times para treinar modelos de linguagem que alimentam o ChatGPT e o Copilot
  • Diz que isso prejudicou a relação do New York Times com seus leitores e reduziu receitas de assinaturas, licenciamento, publicidade e parcerias

Alegações da ação

  • Segundo a ação, esses modelos de IA citam diretamente o conteúdo do New York Times, fazem resumos e imitam seu estilo de escrita, ameaçando o jornalismo de alta qualidade
  • O New York Times afirma que tentou negociar por meses, mas não conseguiu chegar a uma solução
  • Um porta-voz da OpenAI afirmou que a empresa está trabalhando para que criadores de conteúdo possam se beneficiar da tecnologia de IA e de novos modelos de receita

Notícias relacionadas

  • O New York Times bloqueou o rastreador web da OpenAI para impedir que ele continue coletando conteúdo do site
  • Outros veículos de notícias, como BBC, CNN e Reuters, também bloquearam o rastreador web da OpenAI
  • Em contraste, a Axel Springer firmou um acordo com a OpenAI para permitir que o ChatGPT use diretamente informações da Politico e da Business Insider

Opinião do GN⁺

  • Este caso reflete uma questão contemporânea em que o avanço da tecnologia de IA entra em choque com os direitos autorais.
  • A ação por violação de direitos autorais pode desencadear uma importante discussão jurídica e ética sobre como a IA deve utilizar criações humanas.
  • O fato de um grande veículo de notícias como o New York Times enfrentar empresas de IA pode representar um ponto de inflexão significativo para o futuro da tecnologia de IA e para a proteção dos direitos dos criadores de conteúdo.

2 comentários

 
xguru 2023-12-29

De acordo com outra reportagem, a petição exige a exclusão de todas as instâncias de GPT treinadas com materiais do New York Times e a destruição dos conjuntos de dados usados no treinamento. Também solicita uma liminar permanente para impedir atos semelhantes no futuro.
Além disso, inclui a exigência de um valor enorme em custos. "danos legais, danos compensatórios, restituição, danos punitivos e toda e qualquer outra medida cabível permitida por lei ou equidade"

 
GN⁺ 2023-12-28
Opiniões do Hacker News
  • Posição de apoio ao New York Times (NYT)

    • Parece que organizações criativas estão mais uma vez ficando para trás na concorrência, assim como aconteceu no surgimento dos mecanismos de busca modernos.
    • Não condeno a decisão inicial da OpenAI de treinar modelos sem acordos de licenciamento. Se não tivesse feito isso, a revolução da IA talvez nem tivesse acontecido.
    • Mas agora a OpenAI precisa reconhecer o que deve aos criadores de conteúdo e corrigir isso. Caso contrário, pode sofrer perdas maiores e abrir espaço para concorrentes.
  • Sentimentos conflitantes sobre LLMs que consomem conteúdo protegido por direitos autorais e o reproduzem em algo novo

    • Como desenvolvedor de software e autor, considero o avanço dos LLMs interessante, mas me preocupo com o uso de obras por LLMs.
    • Hoje, os LLMs se parecem com sites inferiores que reescrevem conteúdo sem pesquisa original. Isso pode ser tecnicamente legal, mas é um comportamento parasitário que não agrega valor.
    • Para especialistas, os erros e a falta de citações dos LLMs são um problema; para o público em geral, eles provavelmente serão usados para gerar conteúdo de baixo esforço voltado a SEO, o que pode levar à piora da qualidade dos próprios LLMs.
  • Esperança de ampliação do uso justo para treinamento de IA

    • O uso justo para treinamento de IA é mais importante para o futuro da humanidade do que um único veículo de mídia.
    • Mesmo que o NYT desapareça, há muitos veículos que poderiam substituí-lo, mas se a IA for prejudicada logo no início por disputas de propriedade intelectual (PI), isso pode atrapalhar avanços importantes.
  • Argumento fraco sobre imitação do estilo do New York Times e perspectiva negativa para a OpenAI

    • Reproduzir diretamente o conteúdo do New York Times é desfavorável para a OpenAI.
    • É difícil remover conteúdo específico de um LLM, o que sugere que a vida útil dos LLMs será curta.
  • Bloqueios baseados em infração de direitos autorais contra LLMs não promovem o progresso da ciência e das artes úteis

    • Os LLMs precisam de regulação, mas de outro tipo de regulação, não baseada em direitos autorais.
    • A ideia inicial mais aberta da OpenAI era boa, mas agora é necessária intervenção pública.
  • Crítica à possibilidade de uma empresa monopolizar toda a produção humana

    • Esse tipo de conduta é, no mínimo, descarada e errada, e talvez vergonhosa.
    • Como há vítimas demais, a OpenAI pode contar com a inviabilidade prática de ações judiciais e com a possibilidade de os tribunais decidirem previamente não indenizar os prejudicados.
  • Acesso livre a conteúdo publicado na internet e legitimidade do uso de dados por máquinas

    • Se humanos podem acessar um conteúdo, as máquinas também deveriam poder acessá-lo.
    • As máquinas podem assumir tarefas que os humanos fazem, liberando tempo para atividades mais interessantes.
  • Comportamento parasitário dos LLMs e comparação com trolls de patentes

    • Os LLMs aproveitam padrões linguísticos de corpora de texto que os criadores não estavam usando para treinar modelos.
    • Isso não beneficia a sociedade e só favorece os trolls. Não há motivo para os tribunais imporem isso.
  • Menção ao processo movido pelo New York Times contra a OpenAI e a Microsoft

    • O New York Times alega que suas milhões de matérias foram copiadas e usadas para construir modelos de IA.