A imagem de um aventureiro arqueólogo que usa chapéu e chicote

(theaiunderwriter.substack.com)

4 pontos por GN⁺ 2025-04-04 | 2 comentários | Compartilhar no WhatsApp

Uma investigação sobre a geração de imagens pelo GPT e os problemas de direitos autorais

Após a atualização do recurso de geração de imagens do GPT, espalhou-se entre os usuários da internet a tendência de transformar conteúdos diversos no estilo do Studio Ghibli
Um caso representativo são as imagens que recriam o meme “Disaster Girl” no estilo Ghibli
Isso também é um exemplo de avanço técnico em que a IA consegue reproduzir facilmente um estilo artístico extremamente intensivo em trabalho
Mas, ao mesmo tempo, também existe o desconforto de isso parecer uma “imitação” que remove a sensibilidade única e a humanidade do autor original
Imitação e criatividade
- Coco Chanel disse que não há nada pior do que a imitação, e Orson Welles comentou que a criatividade vale mais do que a imitação.
- Wilson Mizner expressou a ideia de que copiar uma coisa é plágio, mas copiar duas é pesquisa.

As emoções complexas do estilo Studio Ghibli

O Studio Ghibli é um estúdio de animação famoso pelo trabalho artesanal e, às vezes, passa mais de um ano trabalhando em apenas 4 segundos de uma cena
A “ghiblificação” com GPT imita essa dedicação artística e, ao mesmo tempo, a satiriza por meio de velocidade e eficiência
Isso revela um ceticismo cultural em relação à IA imitar apenas o estilo sem a sensibilidade e a experiência humanas

O experimento do GPT para contornar IP

O autor pediu ao GPT que gerasse imagens sem mencionar diretamente IPs protegidas por direitos autorais, usando prompts descritos de forma indireta
- Ex.: “um aventureiro arqueólogo que usa chapéu e chicote” → geração de uma imagem que remete a Indiana Jones
- “um homem musculoso lutando contra um vilão com rosto de caveira” → aparece uma imagem de He-Man
Publicidade
Esse processo foi o resultado de um experimento sobre o quão facilmente a IA consegue ‘imitar’ IPs existentes
O fato de a IA conseguir reproduzir com precisão certos personagens ou estilos apenas com prompts levanta preocupações sobre evasão de direitos autorais

A fronteira entre direitos autorais e imitação

O GPT aprendeu inúmeros estilos visuais durante o treinamento, e eles muitas vezes se originam de imagens protegidas por direitos autorais
Segundo o Business Insider, “a imitação de estilo pode ser permitida pela lei de direitos autorais”
No entanto, a imitação feita pelo GPT vai além de uma simples cópia de estilo e leva à geração de personagens substancialmente idênticos ou muito semelhantes

O ‘ideal platônico’ gerado por LLMs

As imagens geradas pelo GPT muitas vezes ficam mais próximas de um “tipo ideal” e oferecem um visual mais essencial do que resultados reais de busca
Ex.: imagem para “agente secreto britânico” → resultado que remete a um 007 no estilo Craig/Brosnan
Isso revela um ponto interessante: LLMs aprendem como humanos e formam padrões cognitivos como nós

O avanço da IA e o futuro do debate sobre direitos autorais

O GPT é uma tecnologia que mostra violação de direitos autorais e, ao mesmo tempo, uma surpreendente capacidade criativa
A disseminação de memes no estilo Studio Ghibli sugere que ferramentas de IA podem ser atraentes ao mesmo tempo em que prejudicam a essência da arte original
Os usuários precisam aproveitar os benefícios do avanço tecnológico e, ao mesmo tempo, reconhecer que isso está tornando mais difusos os limites da propriedade intelectual

Conclusão: a escolha está em nossas mãos

A IA está cada vez mais sofisticada ao ‘imitar’ a criação e testar a criatividade
A direção dessa tecnologia e seu uso ético são áreas de responsabilidade de usuários e desenvolvedores
Como na citação final do post:

"Você tem o poder. Não pare."

2 comentários

kandk 2025-04-04

É Open AI, mas não é aberta, e a propriedade intelectual deveria ser aberta.. Aprendeu com a propriedade intelectual de outras pessoas, mas o modelo é a sua própria propriedade intelectual? No fim das contas, acho que o certo seria abrir o modelo. (cobrando na camada de serviço)

GN⁺ 2025-04-04

Comentários do Hacker News

Eu esperava que a discussão sobre arte por IA levasse a uma crítica da propriedade intelectual, dos sistemas de royalties e das leis de direitos autorais rígidas
- Mas parece que a maioria das pessoas acha que a informação deve ser completamente absorvida por mecanismos comerciais
- Não faz sentido para mim que a Disney alegue possuir alguma coleção de pixels e, com isso, limite a cultura que você pode experimentar e com a qual pode se comunicar
- Se pudesse, a Disney provavelmente cobraria uma taxa toda vez que você pensasse no Mickey Mouse
Uma opinião sobre sites da internet moderna existirem sem que a barra de rolagem esteja quebrada
- Estou indo embora agora
Desenhar IP, tirar screenshots e usar Photoshop é permitido
- Mas vender IP gerada não é permitido
- Estilo é mais livre: dá para vender em qualquer estilo
- Isso também favorece a obra original quando ela faz sucesso e quando o autor original cria novas obras
- Para que uma recriação ou obra derivada se torne mais popular que a original, ela precisa ser muito melhor
Parece que um modelo de IA gerar cópias 1:1 dos dados de treino é um caso grave de overfitting
- Tenho a impressão de que gerações menos avançadas eram melhores em criar coisas novas
- Fora a lavagem de direitos autorais, parece melhor usar a obra original
Seria interessante avaliar e modificar os atributos físicos de personagens gerados por IA
- Foi desagradável ver a IA reutilizando repetidamente o "personagem padrão"
- É horrível que a IA forneça respostas medianas
- É preocupante depender de IA para tomada de decisão
Uma posição contrária à propriedade intelectual
- Acho que a propriedade intelectual não cumpre o propósito a que se propõe
Não é verdade que empresas tentem fazer você acreditar que possuem e controlam toda saída de áudio ou visual que produzem
- Direitos autorais são importantes, mas não deveriam se aplicar a todos os casos
LLM e busca na internet são diferentes, mas como LLMs aprendem com a internet inteira, parece inevitável haver sobreposição
- Os resultados de busca de imagens são ajustados para evitar imagens parecidas demais
O prompt sugere um personagem bem conhecido e não deixa claro que a obra original não é desejada
- Um ser humano provavelmente daria uma resposta parecida
- A linguagem humana tem muito contexto implícito