- Apesar do hype em torno das ferramentas de programação baseadas em LLM, a qualidade dos resultados reais do desenvolvimento de software não melhorou muito e, ao contrário, há uma proliferação de entregas mais próximas de falsificações (forgery)
- A essência do que um LLM faz é permitir que um indivíduo imite resultados potenciais, seus ou de terceiros, e os produza mais rápido; o problema surge quando isso é usado como substituto do original
- Projetos open source estão sofrendo danos reais com PRs de baixa qualidade gerados por IA, a ponto de fecharem contribuições públicas ou encerrarem programas de bug bounty
- Enquanto a indústria de jogos resiste de forma eficaz, impulsionada pelos consumidores, exigindo rotulagem e filtragem de conteúdo gerado por IA, engenheiros de software vêm aceitando isso sem defesa
- Para que LLMs parem de mentir, atribuição correta da fonte (source attribution) é indispensável, mas isso é tecnicamente impossível na arquitetura atual dos modelos
Contestando a narrativa da inevitabilidade do uso de IA
- Segundo o hype do setor, o desenvolvimento de software tradicional acabou, mas após anos usando ferramentas baseadas em LLM os resultados continuam em nível quase igual ao de antes
- Uma quantidade enorme de hype em torno da tecnologia atrai investimentos maciços, e esses investimentos passam a exigir ainda mais hype em um ciclo contínuo
- Novos modelos continuam sendo treinados para cumprir promessas que modelos já aposentados deveriam ter cumprido
- "Está tudo bem não usar IA" — isso não é uma postura ultrapassada, e pode até ser menos estressante e mais satisfatório do que aderir à IA
Artesanato (Craft) vs produção em massa (Kraft): a moldura da falsificação
- Entre as várias formas de enquadrar o que os LLMs fazem (ajuda, criatividade, produtividade vs preguiça, descartabilidade, apropriação), a palavra que surpreendentemente falta é falsificação (forgery)
- Se alguém pinta no estilo de Van Gogh e coloca sua assinatura, isso é falsificação; fingir um documento jurídico é falsificação; uma pesquisa com dados manipulados é falsificação — o fato de algo ser falso está embutido no objeto e em como ele foi feito
- LLMs são ferramentas que permitem a uma pessoa criar falsificações mais rapidamente de resultados potenciais, seus ou de terceiros
- Imitação por si só é legal como forma de liberdade de expressão, mas o problema começa quando se tenta usar a falsificação como substituto do original
- Você não será preso por "falsificar" uma carta do Papai Noel, mas possuir até mesmo uma "moeda falsa" extremamente sofisticada apenas como item de coleção também não é permitido em certas jurisdições
A analogia com proteção de origem e padrões de qualidade
- Alimentos com origem controlada, como o francês "Brie de Meaux", exigem ao mesmo tempo método tradicional de produção, matérias-primas de alta qualidade e origem geográfica específica
- Permitir produção no exterior inevitavelmente leva a uma inundação de imitações baratas, que prejudica a marca do produto autêntico e ameaça uma especialização local rara, transmitida por gerações
- O julgamento individual de cada consumidor, por si só, não garante o funcionamento adequado do mercado; o que aparece nas prateleiras já é determinado por fatores fora do controle do consumidor
- A qualidade de um queijo artesanal representa toda uma cadeia de suprimentos operando com métodos modernos, e transplantá-la para outro lugar exige investimento maciço em capital humano, infraestrutura e agricultura
- Toda sociedade precisa traçar uma linha entre "queijo artesanal tradicional" e "ovos falsos feitos com produtos químicos industriais"; só uma sociedade que entende e preserva o valor do artesanato alimentar consegue evitar taxas de obesidade acima de 70% (caso de Nauru)
Os danos do slop de IA no open source e na programação cotidiana
- Mantenedores de open source foram os primeiros a sentir os efeitos colaterais — já era muito difícil encontrar contribuidores realmente motivados e adaptá-los aos objetivos do projeto e à mentalidade de engenharia
- Surgiram contribuidores enviando PRs codados com slop para inflar currículo no GitHub
- O tldraw fechou contribuições públicas, o projeto curl encerrou o bug bounty, e outros projetos responderam zombando de contribuidores falsos
- Efeitos semelhantes aparecem no dia a dia ao trabalhar com colegas de vibe-coding — parece que o júnior se adapta rapidamente, mas na prática ele está terceirizando a fase inicial de aprendizado para o bot
- Em 2026, se um funcionário júnior envia um PR com explicações e comentários extremamente detalhados, é preciso desconfiar de cada palavra
Engenheiros sêniores e a ilusão da produtividade 10x/100x
- Diz-se que veteranos experientes usando IA produzem 10x ou 100x mais código do que antes, mas isso ainda ignora o fato de que cada linha de código executada e da qual se depende é uma responsabilidade (liability)
- A afirmação de que "programação com IA é ótima porque tudo de que o agente precisa já está explicado no codebase" é fatalmente equivocada — se isso fosse verdade, não haveria trabalho real de programação a fazer
- A diferença crucial está em se o engenheiro passou a maior parte da carreira resolvendo problemas criados por outros softwares ou resolvendo problemas que as pessoas já tinham antes de existir software
- Só o segundo caso ensina a pensar nas restrições reais do problema e nas necessidades do usuário
- Quando o software vira um fim em si mesmo, algo que caberia em um VPS de US$ 10/mês acaba transformado em uma nuvem de infraestrutura superengenheirada
Características do código slop e a reação do setor
- Engenheiros com senso de artesanato detectam slop com facilidade na revisão — na forma de repetição excessiva de código, complexidade desnecessária e recusa em refatorar, entre outros sinais
- Observa-se que até sêniores, apesar de anos de experiência, cometem erros constrangedores ao fazer vibe-coding e os repassam adiante
- Houve o caso em que o Discord do Co-pilot da Microsoft proibiu o insulto "Microslop" — enquadrando a reação dos usuários como "spam" ou "tóxica", num cenário em que a promessa é tratada como mais importante do que o resultado real
- Essas ferramentas são descritas como "viciantes" ou como "o melhor amigo que você pode ter", mas a suposta explosão cambriana de criatividade e realização que viria com isso não aparece
Problemas estruturais da indústria de software e o papel da IA
- O que a IA produz em grande parte é código cola (glue code), exigido porque, desde a revolução do PC, os aplicativos de software ficaram mais fechados, mais distribuídos e mais corporativos
- APIs HTTP exigem blobs JSON mal documentados cujo schema muda toda noite, e por isso não oferecem abertura real
- Muitas empresas ainda operam principalmente em Excel, e não existe uma ferramenta equivalente ao Excel para JSON
- Prometeram que SQL libertaria os negócios da dependência de ferramentas proprietárias, mas isso fracassou; a história está se repetindo
- Se apps Electron feitos por vibe-coding continuam sendo preferidos a apps nativos multiplataforma, então onde está, de fato, a tal produtividade 100x?
- Se nem a Apple consegue manter um sistema adequado de formulários e ícones nos sistemas operacionais mais recentes, as perspectivas de uma IA treinada em slop da web são ainda menores
A resistência eficaz da indústria de jogos
- Enquanto engenheiros de software mergulharam nisso sem colete salva-vidas, a indústria de jogos vem resistindo com eficácia, liderada pelos consumidores
- Vários jogos pediram desculpas e removeram conteúdo de IA não rotulado
- A Steam tem uma política clara para conteúdo de IA, e o SteamDB oferece ferramentas para filtrar jogos gerados por IA
- Uma atualização recente da política da Steam passou a excluir usos de "ganho de eficiência" em ferramentas de desenvolvimento que não geram conteúdo apresentado ao jogador
- Há dois motivos para o mercado de jogos resistir de forma eficaz:
- É um mercado de distribuição digital D2C puro (venda direta ao consumidor) — os gamers têm todo o poder de escolha, e os formadores de gosto que exigem transparência são os próprios jogadores
- A maioria dos jogos é artística e comprada justamente por um apelo artístico específico — na arte, imitação é vista como algo que reduz o valor do original e rouba crédito
O contraste entre reutilização de código e originalidade artística
- Código, em geral, não é prejudicado pela reutilização e, no caso de infraestrutura, isso pode até ser benéfico
- É por isso que projetos open source são particularmente inadequados para atrair criativos artísticos talentosos — o espírito de compartilhamento sem custo significa que o design artístico é imediatamente apropriado fora de contexto
- A clássica geração procedural (procedural generation) merece atenção como precedente, e em geral não correspondeu às expectativas
- O caso de No Man's Sky (versão de 2016) — a promessa de criar conteúdo exponencial a partir de fontes limitadas acabou tornando sem valor a diversidade do próprio resultado
IA generativa, bibliotecas piratas e ambiguidade jurídica
- É natural que artistas denunciem a IA generativa como plágio em massa, e também é natural que empreendedores de tecnologia e organizadores de dados não entendam isso e treinem modelos com bibliotecas-sombra piratas
- A Nvidia foi acusada de tentar negociar acesso de alta velocidade à vasta coleção de livros piratas do Anna's Archive
- Há uma razão clara para que os resultados sejam medianos, toscos e suspeitos — a variedade das amostras de treino é, ela mesma, apenas slop para máquinas
- Isso cria uma negação plausível (plausible deniability) em que é impossível distinguir o que é citação, o que é alucinação e o que é original
- Colocar um rótulo de conteúdo gerado por IA ou marca-d'água em conteúdo de IA é, na maioria das vezes, apenas uma forma de evitar responsabilidade, não uma divulgação realmente responsável
- Para que vibe-coding seja aceitável e justificável, seria preciso adotar a posição paradoxal de que a produção do próprio engenheiro é descartável, não criativa e não merece crédito
Atribuição de fonte (Source Attribution) como solução
- Nenhum tribunal deveria ter decidido sobre a legalidade ou a possibilidade de copyright de toda a produção de IA de forma genérica; resultados sem fonte deveriam ser tratados como falsificação
- A solução para o problema dos LLMs é clara, mas inalcançável: que o LLM faça atribuição correta da fonte junto com o raciocínio
- Isso revelaria, não só do ponto de vista artístico, mas também que boa parte do vibe code é copiar/colar de codebases existentes sem autor original, licença ou links
- Nos modelos atuais, atribuição real é tecnicamente impossível — a própria capacidade do LLM de mencionar e citar fontes é uma propriedade emergente (emergent property) dos dados coletados
- O LLM só consegue citar fontes quando isso parece apropriado para a posição atual no texto, o que não passa de um role-play de citação (citation role-play): citar bem aquilo que costuma ser citado corretamente
- As implicações de exigir atribuição são enormes: se os pesos precisam ser atribuíveis e o forward pass auditável, como seria o backpropagation? Certamente não caberia em
int4
- É exatamente esse o problema que as "ferramentas de detecção de IA" tentam resolver ao contrário
- É paradoxal que a tecnologia seguinte à World Wide Web e a buscadores na escala do Google seja justamente uma tecnologia que, por design, não consegue informar a origem da informação
- Se as máquinas quiserem parar de mentir, precisam citar corretamente suas fontes — e as empresas de IA também
3 comentários
O que é isso, minha capacidade de vocabulário está começando a falhar.
Estou aqui sentado pesquisando por "emergente, slop, atribuição de fonte, efeito de enquadramento, explosão cambriana".
Comentários do Hacker News
O mercado de videogames parece ser um caso raro em que consumidores reagiram contra IA, mas na prática houve reação apenas a assets de arte por IA
Ninguém liga se o código foi escrito por IA ou não. Pela pesquisa da Steam sobre IA, a geração de código já é permitida
No fim, a disseminação da programação com LLM é inevitável. O mesmo vale para geração procedural: depende mais da capacidade de quem usa do que da ferramenta em si
A discussão sobre LLM está ficando cansativa. Essa tecnologia está sendo usada mais para controlar do que para empoderar as pessoas, facilitar demissões e concentrar ainda mais riqueza
É como porcos debatendo a utilidade de uma máquina de bacon
O movimento ludita não era simples antitecnologia. Eles se preocupavam com a queda de qualidade, e estavam certos
Os cachecóis de lã artesanais da Europa medieval eram completamente diferentes dos produtos de fábrica modernos. O avanço tecnológico nem sempre é uma substituição 1:1
Ainda hoje, ao ver ferramentas internas feitas por não técnicos economizando centenas de horas, fica claro que, mesmo sem perfeição, se funciona e gera efeito, já basta
O que LLM revelou é que a maior parte da programação é código boilerplate
O valor real está em pequenas inovações de nível mais alto
O uso ideal de LLM é como professor. É melhor usá-lo como ferramenta para ensinar conceitos rapidamente, em vez de gerar código
Como queijo ou presunto artesanal, talvez no futuro exista Artisanal Coding
Acabou virando uma máquina que transpõe especificações para código no lugar de humanos
A realidade fria é que ninguém se importa com o nosso código em si
A maioria só liga para se funciona, quão rápido é e quanto custa. No fim, estamos mais para operários de fábrica
É parecido com a sensação de perda que um relojoeiro teria ao ver um torno automático
No fim, a narrativa romântica do “trabalho criativo” que sustentávamos está desmoronando
Toda essa discussão no fim parece mais um problema da natureza humana, que se repete como o meme TTP(Time To Penis)
Este texto mostra uma visão realmente realista e equilibrada
Tanto o texto quanto os comentários estão surpreendentemente negativos. Será que ninguém aqui sequer já experimentou rodar o Claude Code..