2 pontos por GN⁺ 2025-05-13 | 1 comentários | Compartilhar no WhatsApp
  • O Escritório de Direitos Autorais dos EUA reconheceu oficialmente, recentemente, casos de violação de direitos autorais por empresas de IA
  • Apontou que algoritmos de IA utilizam um enorme volume de materiais protegidos por direitos autorais e que são necessários consentimento e compensação aos criadores
  • O relatório conclui que, em algumas situações, a defesa de uso justo (fair use) não se sustenta
  • Grandes empresas como OpenAI, Google, Meta e Microsoft estão sendo processadas por essa questão
  • A situação está se tornando mais complexa com a sobreposição entre políticas pró-IA e demissões políticas de nomeações

Visão geral do relatório do Escritório de Direitos Autorais dos EUA e da demissão da diretora

  • A demissão da diretora do Escritório de Direitos Autorais dos EUA ocorreu logo após um relatório concluir que empresas que desenvolvem modelos de IA ultrapassaram os limites tradicionais do uso justo ao utilizar materiais protegidos por direitos autorais
  • Este relatório traz opiniões contidas no rascunho do terceiro relatório sobre direitos autorais e IA
  • O primeiro relatório tratou do problema da reprodução digital, e o segundo examinou a possibilidade de proteção autoral para resultados de IA generativa

Principais pontos do rascunho do relatório

  • Em 9 de maio, foi divulgado o rascunho de um relatório (PDF) sobre o uso de obras no desenvolvimento de sistemas de IA generativa
  • Ficou claramente demonstrado que sistemas de IA utilizam grandes volumes de dados, ou seja, materiais protegidos por direitos autorais
  • Levantou-se a questão de saber se a IA deve obter consentimento ou pagar compensação aos titulares de direitos autorais
  • Esse é, de fato, o ponto central de vários processos judiciais
  • Empresas de desenvolvimento de IA reconheceram que treinaram seus produtos com conteúdo da internet e de outras fontes sem autorização

Precedentes e critérios sobre uso justo (fair use)

  • Empresas de IA alegam que não há problema jurídico com base na cláusula de uso justo da lei de direitos autorais
  • No entanto, juízes enfatizam que o critério para avaliar uso justo é “se há impacto sobre o mercado potencial ou o valor da obra original”
  • Se esse impacto não for significativo, pode se enquadrar como uso justo
  • O relatório afirma explicitamente que, em determinadas situações, a tese de defesa baseada em uso justo das empresas de IA não pode prevalecer

Impacto do relatório e reação acadêmica

  • O relatório final deve ser publicado em breve sem grandes mudanças
  • O jurista Blake. E Reid avaliou que o relatório é “muito desfavorável para as empresas de IA” e que “pode levar diretamente à derrota nos tribunais”
  • Atualmente, Google, Meta, OpenAI e Microsoft são partes em processos relacionados a direitos autorais

Contexto da demissão e dimensão política

  • Como o momento da demissão da diretora coincidiu com a divulgação do relatório, surgiram dúvidas sobre a posição oficial de que a publicação ocorreu “em resposta a perguntas do Congresso e de partes interessadas”
  • O professor Reid apontou que a divulgação apressada do relatório pelo Escritório de Direitos Autorais pode ser um sinal de uma ação interna de pessoal (purge)
  • De fato, foi noticiado que o governo Trump demitiu a diretora Shira Perlmutter

Repercussão política e ligação com Elon Musk

  • O deputado Joe Morelle destacou que a demissão ocorreu logo após a diretora do Escritório de Direitos Autorais não concordar com a exigência de Elon Musk de usar materiais protegidos por direitos autorais para treinar modelos de IA
  • Musk e Jack Dorsey vêm defendendo a “eliminação de todas as leis de propriedade intelectual (IP)” ou promovendo treinamento de IA por meio de posts no X (antigo Twitter), indicando movimentos por mudanças de política

Outras possíveis razões para a demissão

  • Considerando que o Escritório de Direitos Autorais é um órgão subordinado à Biblioteca do Congresso dos EUA (Library of Congress), menciona-se a possibilidade de relação com o caso recente em que a diretora da biblioteca foi demitida por questões envolvendo políticas de diversidade (DEI) e seleção de livros infantis
  • Portanto, essa demissão pode estar ligada de forma complexa a vários fatores internos e políticos, como política de IA, grandes doadores ou políticas de DEI

1 comentários

 
GN⁺ 2025-05-13
Comentários do Hacker News
  • Menciona-se que, se os EUA passarem a impedir que LLMs usem material protegido por direitos autorais ou exigirem compensação a todos os detentores de direitos, outros países como a China não farão o mesmo. Nesse caso, as empresas americanas de LLM ficariam para trás na competição ou seriam prejudicadas pelos custos. No fim, países como a China acabariam avançando mais no aspecto de utilidade da IA. Claro que acho que devemos fazer o que é certo, mas nas decisões do governo sobre regulação de IA há uma preocupação implícita sobre quem terá a liderança no mundo futuro
    • Por essa lógica, também se conclui que um cidadão comum pode lavar a propriedade intelectual de empresas, já que a China certamente não vai acompanhar. Se o outro lado acha tudo bem, então eu também entro nessa
    • No geral, concordo que permitir acesso total a material protegido por direitos autorais poderia tornar a IA mais poderosa. Ainda assim, questiono o que exatamente significa "mais poderosa". Pensando em segurança nacional, sou a favor de permitir totalmente ao LLM o acesso a informações acadêmicas, científicas e técnicas. Tenho alguma dúvida quanto a código proprietário, mas acredito que já exista dado de código suficiente. Porém, mesmo que os LLMs tenham acesso total a material protegido, não vejo que vantagem prática isso traria em relação a ter acesso apenas a artigos, dados técnicos e material licenciado. No fim, o LLM se tornaria uma máquina de plágio muito mais forte, sem de fato ficar mais inteligente. O mesmo vale para modelos de imagem e vídeo. Com acesso a material protegido, o modelo pode produzir mais imagens ou recriar Mario e Luigi em cenários infinitos, mas não há ganho prático nisso, então esses modelos deveriam até ser proibidos. Não há vantagem importante de segurança ou econômica
    • O verdadeiro problema é que as empresas de IA não estão tentando mudar a lei por conta própria como os grandes conglomerados tradicionais
    • Por outro lado, se há um presidente que impõe tarifa de 145% sobre a China, ele também poderia impor uma tarifa de 1000% sobre chatbots chineses na internet ou até cortar cabos de internet alegando emergência nacional. É incerto o que a China fará daqui para frente, mas pelo menos parece provável que proíba o uso de IA por menores de idade. A questão do uso militar é separada da questão de direitos autorais
    • Se a IA é realmente tão importante assim, então o governo deveria ser dono dela e todos os cidadãos deveriam poder usá-la de graça
    • Essa lógica pode ser aplicada não só à IA, mas a toda violação de propriedade intelectual
    • Pessoalmente, acho difícil acreditar que LLMs realmente contribuam para dominar o mundo, mas esse senso de rivalidade competitiva está no fundo de toda a discussão
    • Antigamente não havia problema nenhum em instalar Windows pirateado. A BSA apareceu, mas agora a Microsoft faz vista grossa porque isso a favorece
  • Demitir alguém por esse motivo é muito estranho. Isso parece uma tentativa de censurar a interpretação da lei. Na minha opinião, treinar modelos com material protegido por direitos autorais é, pela visão tradicional, claramente ilegal. Claro, um ser humano pode ler um livro, se inspirar e escrever outro sem ser processado. Basta olhar para os inúmeros romances de fantasia para ver que nem todos são obras totalmente independentes. Como a IA é útil e inovadora, acho que devemos reconhecer que a lei não contemplou esse caso e que ela precisa ser mudada
    • Foi dito que humanos não são processados por ler livros, se inspirar e escrever, mas na prática casos de gente "inspirada demais" acabam em processo com frequência. Disputas por plágio musical são famosas
    • Do ponto de vista legal, isso já estava suficientemente coberto, mas vemos repetidamente que os poderosos ficam acima da lei. Era perfeitamente possível evitar isso usando apenas material antigo, material Creative Commons, garantindo que a saída ficasse a uma certa distância editorial do original, ou entrando em contato com os detentores dos direitos para pedir permissão. Mas as empresas de IA não fazem nada disso
    • IA é diferente de humanos. O fato de humanos terem direitos não significa que máquinas também os tenham automaticamente. Por essa lógica, descartar um carro seria homicídio
    • Humanos também não podem fazer o que as empresas de IA querem fazer. É como um estudante ir à biblioteca e dizer: "quero copiar todos os livros para estudar". Humanos também são úteis e inovadores
    • Também precisamos reconhecer que algo ser útil não significa automaticamente que seja uma boa ideia
    • Se os direitos autorais deixarem de existir, as empresas ficarão furiosas e o sistema de patentes também entrará em colapso. As empresas americanas perderiam sua capacidade de dominar o mundo. Há o receio de que, em breve, a pirataria de mídia seja redefinida como a única razão da existência dos direitos autorais, e que as instituições existentes virem órgãos de controle e acabem se transformando em agências de censura
    • Você é livre para se inspirar e escrever outro romance, mas, por exemplo, publicar oficialmente "Hairy Plotter and the Philosophizer's Rock" não seria permitido
    • O problema dessa análise é que ela nem discute a razão de existir dos direitos autorais. A crença de que "LLMs deveriam poder treinar com material sem permissão" e a crença de que "direitos autorais fazem sentido" são incompatíveis. Pela Constituição dos EUA, direitos autorais existem para promover o progresso da ciência e das artes; na UE, o objetivo é proteger criadores e incentivar criatividade. Se eu publicar um livro e empresas de tecnologia puderem copiá-lo para treino e depois oferecê-lo novamente aos consumidores, ninguém vai comprar meu livro. Então o investimento para e os livros deixam de ser produzidos
    • Colocar propriedade intelectual em um modelo para fins de venda sem licença não é exceção
    • Se a lei for mudada, ela deve valer para todos e não pode ser um privilégio só para empresas de IA
    • Se quando um humano se inspira em obra protegida e cria algo isso não é visto como infração, então é preciso explicar claramente por que seria diferente quando um robô faz o mesmo. Se a interpretação for de que um robô cria uma dinâmica essencialmente nova, é preciso formular esse argumento de forma executável na prática
    • Não acho que IA seja uma tecnologia tão útil assim. Ela começou nos anos 1950, só agora ficou minimamente utilizável, e ainda assim continua sem funcionar direito
    • Assistir a filmes piratas também é útil, mas isso não o torna legal. Humanos e IA são completamente diferentes, e essa lógica de inspiração humana é uma afirmação sem fundamento
    • Para cantar uma cover, é preciso permissão, e sem permissão isso pode ser ilegal. Já escrever uma música inspirado em outra é legal. Se a obra gerada por IA for suficientemente nova e transformativa, não há problema; mas, se ela copiar diretamente a obra de alguém, então há problema. A lei deveria julgar não por conceitos vagos como alma ou inspiração, mas pela diferença real no resultado
    • Empresas e IA não são humanos nem esquilos. Qual é exatamente o sentido de compará-los com humanos?
    • Entendo o sentimento dos criadores que resistem a software reconstituindo PI sem permissão. Só tenho dúvida se o simples ato de ler o material em si constitui violação de direitos autorais. Ler ou resumir nunca foi algo regulado pela lei existente. Alegações como "as pessoas não podem ler o livro que distribuí", "as pessoas não podem escrever fanfic no meu estilo", ou "as pessoas não podem treinar copiando obras-primas em museus" parecem distantes da realidade. Precisamos de um debate social mais racional e de uma direção melhor aqui
  • Uma mulher de Minnesota recebeu uma multa de 220 mil dólares por baixar ilegalmente 24 músicas
    • Aponta-se que esse caso é diferente do treinamento de modelos por empresas de IA. Argumenta-se que o aprendizado de dados por uma empresa de IA não é o mesmo que compartilhar/distribuir diretamente as músicas para outras pessoas
  • Até hoje quase não vi ninguém explicar simultaneamente, em detalhe, a estrutura técnica do treinamento de modelos transformer e a alegação de violação de direitos autorais. Ou seja, é raro encontrar alguém que entenda tanto o mecanismo de treinamento quanto a lógica da infração. Aqui se está falando do processo de treinamento, não do resultado gerado (inferência)
    • O problema surge quando o transformer reproduz material para o qual não recebeu permissão, e só isso já pode gerar processo. Não está claro se apenas tocar em uma enorme massa de material protegido já constitui violação. Criadores e artistas naturalmente têm interesse nos produtos derivados de suas obras. Se minha obra se tornar desnecessária, então basta excluí-la
    • Operar o modelo em si não é violação de direitos autorais, e treinamento para análise ou pesquisa pode ser aceitável. Mas uso comercial, substituição de mercado etc. seriam vistos como algo além do escopo de fair use
    • Também fico curioso sobre como esse método de treinamento difere de transformers usados em codecs de vídeo, e qual seria a diferença entre compressão com perdas e violação de direitos autorais
    • Como nem mesmo o comportamento humano — por exemplo, escrever a mesma frase — pode ser explicado estruturalmente, não há um caso claro em que se discuta por que exatamente o treinamento de IA seria infração. Ou seja, não há uma discussão que trate ao mesmo tempo de leitura e plágio
    • O ponto central dessa disputa é que as empresas de IA usam livros baixados sem autorização e sem pagar licenças para fins de ingestão
    • Como isso funciona na prática não importa; o que importa é o que se faz no fim das contas
    • Há poucos profissionais que sejam ao mesmo tempo programadores e advogados de direitos autorais, mas não inexistem. No entanto, no fim das contas o importante é como os tribunais vão decidir. Neste caso, esse ponto talvez nem seja realmente importante
    • Se uma máquina copia a obra de outra pessoa, isso é violação de direitos autorais. Humanos e máquinas não são iguais e, como isso não foi comprovado, a lei não permite
    • A pessoa afirma ter provas de infração e compartilha material de referência
    • Quem conhece a estrutura do treinamento tende a achar justamente que não há violação de direitos autorais
  • O relatório preliminar divulgado publicamente parece apenas listar as reclamações dos detentores de direitos. Falta profundidade nos fundamentos
    • Não é preciso uma fundamentação profunda. Se uma IA lê 100 artigos e publica um novo, isso é plágio. Se uma pessoa com memória perfeita reorganiza textos existentes e publica um novo, isso também é violação de direitos autorais. Só as grandes empresas é que acabam sendo exceção
    • Não é apenas uma lista de reclamações. Entende-se que os detentores de direitos estão tentando contornar, pela invalidação do princípio de fair use, uma situação em que estão perdendo espaço nos tribunais
    • Não tenho muita simpatia por eles
  • Não consigo concordar com a conclusão de que, se a IA usar comercialmente uma enorme quantidade de obras protegidas para criar conteúdo que compete com o mercado existente, isso necessariamente ultrapassa fair use. Fico em dúvida sobre por que pegar um pouco de várias fontes e criar algo de forma criativa deixaria de ser fair use. Essa linha de argumento acaba sendo uma pergunta sobre o interesse público e o propósito fundamental dos direitos autorais
  • Aponta-se que há coisas demais acontecendo no governo atual em favor de grupos de interesse específicos
  • Recomenda-se consultar o PDF "Copyright and Artificial Intelligence Part 3: Generative AI Training"
  • Dá a sensação de que a lei de propriedade intelectual está se tornando uma ferramenta de litígios de grandes empresas para reprimir a disseminação de ideias. Se for ilegal conhecer todo o conteúdo de um livro, fica ambíguo até onde se pode restringir até mesmo a codificação de certo nível de compreensão do conteúdo. Quando um juiz decide isso, a questão deixa de ser só cópia comercial e passa a ser controle do conhecimento coletivo da humanidade
  • Há concordância de que esta mesma questão continua se repetindo em debates anteriores