4 pontos por GN⁺ 2025-04-04 | 2 comentários | Compartilhar no WhatsApp

Uma investigação sobre a geração de imagens pelo GPT e os problemas de direitos autorais

  • Após a atualização do recurso de geração de imagens do GPT, espalhou-se entre os usuários da internet a tendência de transformar conteúdos diversos no estilo do Studio Ghibli
  • Um caso representativo são as imagens que recriam o meme “Disaster Girl” no estilo Ghibli
  • Isso também é um exemplo de avanço técnico em que a IA consegue reproduzir facilmente um estilo artístico extremamente intensivo em trabalho
  • Mas, ao mesmo tempo, também existe o desconforto de isso parecer uma “imitação” que remove a sensibilidade única e a humanidade do autor original
  • Imitação e criatividade
    • Coco Chanel disse que não há nada pior do que a imitação, e Orson Welles comentou que a criatividade vale mais do que a imitação.
    • Wilson Mizner expressou a ideia de que copiar uma coisa é plágio, mas copiar duas é pesquisa.

As emoções complexas do estilo Studio Ghibli

  • O Studio Ghibli é um estúdio de animação famoso pelo trabalho artesanal e, às vezes, passa mais de um ano trabalhando em apenas 4 segundos de uma cena
  • A “ghiblificação” com GPT imita essa dedicação artística e, ao mesmo tempo, a satiriza por meio de velocidade e eficiência
  • Isso revela um ceticismo cultural em relação à IA imitar apenas o estilo sem a sensibilidade e a experiência humanas

O experimento do GPT para contornar IP

  • O autor pediu ao GPT que gerasse imagens sem mencionar diretamente IPs protegidas por direitos autorais, usando prompts descritos de forma indireta
    • Ex.: “um aventureiro arqueólogo que usa chapéu e chicote” → geração de uma imagem que remete a Indiana Jones
    • “um homem musculoso lutando contra um vilão com rosto de caveira” → aparece uma imagem de He-Man
  • Esse processo foi o resultado de um experimento sobre o quão facilmente a IA consegue ‘imitar’ IPs existentes
  • O fato de a IA conseguir reproduzir com precisão certos personagens ou estilos apenas com prompts levanta preocupações sobre evasão de direitos autorais

A fronteira entre direitos autorais e imitação

  • O GPT aprendeu inúmeros estilos visuais durante o treinamento, e eles muitas vezes se originam de imagens protegidas por direitos autorais
  • Segundo o Business Insider, “a imitação de estilo pode ser permitida pela lei de direitos autorais”
  • No entanto, a imitação feita pelo GPT vai além de uma simples cópia de estilo e leva à geração de personagens substancialmente idênticos ou muito semelhantes

O ‘ideal platônico’ gerado por LLMs

  • As imagens geradas pelo GPT muitas vezes ficam mais próximas de um “tipo ideal” e oferecem um visual mais essencial do que resultados reais de busca
  • Ex.: imagem para “agente secreto britânico” → resultado que remete a um 007 no estilo Craig/Brosnan
  • Isso revela um ponto interessante: LLMs aprendem como humanos e formam padrões cognitivos como nós

O avanço da IA e o futuro do debate sobre direitos autorais

  • O GPT é uma tecnologia que mostra violação de direitos autorais e, ao mesmo tempo, uma surpreendente capacidade criativa
  • A disseminação de memes no estilo Studio Ghibli sugere que ferramentas de IA podem ser atraentes ao mesmo tempo em que prejudicam a essência da arte original
  • Os usuários precisam aproveitar os benefícios do avanço tecnológico e, ao mesmo tempo, reconhecer que isso está tornando mais difusos os limites da propriedade intelectual

Conclusão: a escolha está em nossas mãos

  • A IA está cada vez mais sofisticada ao ‘imitar’ a criação e testar a criatividade
  • A direção dessa tecnologia e seu uso ético são áreas de responsabilidade de usuários e desenvolvedores
  • Como na citação final do post:

    "Você tem o poder. Não pare."

2 comentários

 
kandk 2025-04-04

É Open AI, mas não é aberta, e a propriedade intelectual deveria ser aberta.. Aprendeu com a propriedade intelectual de outras pessoas, mas o modelo é a sua própria propriedade intelectual? No fim das contas, acho que o certo seria abrir o modelo. (cobrando na camada de serviço)

 
GN⁺ 2025-04-04
Comentários do Hacker News
  • Eu esperava que a discussão sobre arte por IA levasse a uma crítica da propriedade intelectual, dos sistemas de royalties e das leis de direitos autorais rígidas

    • Mas parece que a maioria das pessoas acha que a informação deve ser completamente absorvida por mecanismos comerciais
    • Não faz sentido para mim que a Disney alegue possuir alguma coleção de pixels e, com isso, limite a cultura que você pode experimentar e com a qual pode se comunicar
    • Se pudesse, a Disney provavelmente cobraria uma taxa toda vez que você pensasse no Mickey Mouse
  • Uma opinião sobre sites da internet moderna existirem sem que a barra de rolagem esteja quebrada

    • Estou indo embora agora
  • Desenhar IP, tirar screenshots e usar Photoshop é permitido

    • Mas vender IP gerada não é permitido
    • Estilo é mais livre: dá para vender em qualquer estilo
    • Isso também favorece a obra original quando ela faz sucesso e quando o autor original cria novas obras
    • Para que uma recriação ou obra derivada se torne mais popular que a original, ela precisa ser muito melhor
  • Parece que um modelo de IA gerar cópias 1:1 dos dados de treino é um caso grave de overfitting

    • Tenho a impressão de que gerações menos avançadas eram melhores em criar coisas novas
    • Fora a lavagem de direitos autorais, parece melhor usar a obra original
  • Seria interessante avaliar e modificar os atributos físicos de personagens gerados por IA

    • Foi desagradável ver a IA reutilizando repetidamente o "personagem padrão"
    • É horrível que a IA forneça respostas medianas
    • É preocupante depender de IA para tomada de decisão
  • Uma posição contrária à propriedade intelectual

    • Acho que a propriedade intelectual não cumpre o propósito a que se propõe
  • Não é verdade que empresas tentem fazer você acreditar que possuem e controlam toda saída de áudio ou visual que produzem

    • Direitos autorais são importantes, mas não deveriam se aplicar a todos os casos
  • LLM e busca na internet são diferentes, mas como LLMs aprendem com a internet inteira, parece inevitável haver sobreposição

    • Os resultados de busca de imagens são ajustados para evitar imagens parecidas demais
  • O prompt sugere um personagem bem conhecido e não deixa claro que a obra original não é desejada

    • Um ser humano provavelmente daria uma resposta parecida
    • A linguagem humana tem muito contexto implícito