O L em LLM significa "Mentira"

(acko.net)

13 pontos por GN⁺ 2026-03-06 | 3 comentários | Compartilhar no WhatsApp

Apesar do hype em torno das ferramentas de programação baseadas em LLM, a qualidade dos resultados reais do desenvolvimento de software não melhorou muito e, ao contrário, há uma proliferação de entregas mais próximas de falsificações (forgery)
A essência do que um LLM faz é permitir que um indivíduo imite resultados potenciais, seus ou de terceiros, e os produza mais rápido; o problema surge quando isso é usado como substituto do original
Projetos open source estão sofrendo danos reais com PRs de baixa qualidade gerados por IA, a ponto de fecharem contribuições públicas ou encerrarem programas de bug bounty
Enquanto a indústria de jogos resiste de forma eficaz, impulsionada pelos consumidores, exigindo rotulagem e filtragem de conteúdo gerado por IA, engenheiros de software vêm aceitando isso sem defesa
Para que LLMs parem de mentir, atribuição correta da fonte (source attribution) é indispensável, mas isso é tecnicamente impossível na arquitetura atual dos modelos

Contestando a narrativa da inevitabilidade do uso de IA

Segundo o hype do setor, o desenvolvimento de software tradicional acabou, mas após anos usando ferramentas baseadas em LLM os resultados continuam em nível quase igual ao de antes
Uma quantidade enorme de hype em torno da tecnologia atrai investimentos maciços, e esses investimentos passam a exigir ainda mais hype em um ciclo contínuo
Novos modelos continuam sendo treinados para cumprir promessas que modelos já aposentados deveriam ter cumprido
"Está tudo bem não usar IA" — isso não é uma postura ultrapassada, e pode até ser menos estressante e mais satisfatório do que aderir à IA

Artesanato (Craft) vs produção em massa (Kraft): a moldura da falsificação

Entre as várias formas de enquadrar o que os LLMs fazem (ajuda, criatividade, produtividade vs preguiça, descartabilidade, apropriação), a palavra que surpreendentemente falta é falsificação (forgery)
Se alguém pinta no estilo de Van Gogh e coloca sua assinatura, isso é falsificação; fingir um documento jurídico é falsificação; uma pesquisa com dados manipulados é falsificação — o fato de algo ser falso está embutido no objeto e em como ele foi feito
LLMs são ferramentas que permitem a uma pessoa criar falsificações mais rapidamente de resultados potenciais, seus ou de terceiros
Imitação por si só é legal como forma de liberdade de expressão, mas o problema começa quando se tenta usar a falsificação como substituto do original
Você não será preso por "falsificar" uma carta do Papai Noel, mas possuir até mesmo uma "moeda falsa" extremamente sofisticada apenas como item de coleção também não é permitido em certas jurisdições

A analogia com proteção de origem e padrões de qualidade

Alimentos com origem controlada, como o francês "Brie de Meaux", exigem ao mesmo tempo método tradicional de produção, matérias-primas de alta qualidade e origem geográfica específica
Permitir produção no exterior inevitavelmente leva a uma inundação de imitações baratas, que prejudica a marca do produto autêntico e ameaça uma especialização local rara, transmitida por gerações
O julgamento individual de cada consumidor, por si só, não garante o funcionamento adequado do mercado; o que aparece nas prateleiras já é determinado por fatores fora do controle do consumidor
A qualidade de um queijo artesanal representa toda uma cadeia de suprimentos operando com métodos modernos, e transplantá-la para outro lugar exige investimento maciço em capital humano, infraestrutura e agricultura
Toda sociedade precisa traçar uma linha entre "queijo artesanal tradicional" e "ovos falsos feitos com produtos químicos industriais"; só uma sociedade que entende e preserva o valor do artesanato alimentar consegue evitar taxas de obesidade acima de 70% (caso de Nauru)

Os danos do slop de IA no open source e na programação cotidiana

Mantenedores de open source foram os primeiros a sentir os efeitos colaterais — já era muito difícil encontrar contribuidores realmente motivados e adaptá-los aos objetivos do projeto e à mentalidade de engenharia
Surgiram contribuidores enviando PRs codados com slop para inflar currículo no GitHub
- O tldraw fechou contribuições públicas, o projeto curl encerrou o bug bounty, e outros projetos responderam zombando de contribuidores falsos
Efeitos semelhantes aparecem no dia a dia ao trabalhar com colegas de vibe-coding — parece que o júnior se adapta rapidamente, mas na prática ele está terceirizando a fase inicial de aprendizado para o bot
Em 2026, se um funcionário júnior envia um PR com explicações e comentários extremamente detalhados, é preciso desconfiar de cada palavra

Engenheiros sêniores e a ilusão da produtividade 10x/100x

Diz-se que veteranos experientes usando IA produzem 10x ou 100x mais código do que antes, mas isso ainda ignora o fato de que cada linha de código executada e da qual se depende é uma responsabilidade (liability)
A afirmação de que "programação com IA é ótima porque tudo de que o agente precisa já está explicado no codebase" é fatalmente equivocada — se isso fosse verdade, não haveria trabalho real de programação a fazer
A diferença crucial está em se o engenheiro passou a maior parte da carreira resolvendo problemas criados por outros softwares ou resolvendo problemas que as pessoas já tinham antes de existir software
- Só o segundo caso ensina a pensar nas restrições reais do problema e nas necessidades do usuário
Quando o software vira um fim em si mesmo, algo que caberia em um VPS de US$ 10/mês acaba transformado em uma nuvem de infraestrutura superengenheirada

Características do código slop e a reação do setor

Engenheiros com senso de artesanato detectam slop com facilidade na revisão — na forma de repetição excessiva de código, complexidade desnecessária e recusa em refatorar, entre outros sinais
Observa-se que até sêniores, apesar de anos de experiência, cometem erros constrangedores ao fazer vibe-coding e os repassam adiante
Houve o caso em que o Discord do Co-pilot da Microsoft proibiu o insulto "Microslop" — enquadrando a reação dos usuários como "spam" ou "tóxica", num cenário em que a promessa é tratada como mais importante do que o resultado real
Essas ferramentas são descritas como "viciantes" ou como "o melhor amigo que você pode ter", mas a suposta explosão cambriana de criatividade e realização que viria com isso não aparece

Problemas estruturais da indústria de software e o papel da IA

O que a IA produz em grande parte é código cola (glue code), exigido porque, desde a revolução do PC, os aplicativos de software ficaram mais fechados, mais distribuídos e mais corporativos
APIs HTTP exigem blobs JSON mal documentados cujo schema muda toda noite, e por isso não oferecem abertura real
Muitas empresas ainda operam principalmente em Excel, e não existe uma ferramenta equivalente ao Excel para JSON
Prometeram que SQL libertaria os negócios da dependência de ferramentas proprietárias, mas isso fracassou; a história está se repetindo
Se apps Electron feitos por vibe-coding continuam sendo preferidos a apps nativos multiplataforma, então onde está, de fato, a tal produtividade 100x?
Se nem a Apple consegue manter um sistema adequado de formulários e ícones nos sistemas operacionais mais recentes, as perspectivas de uma IA treinada em slop da web são ainda menores

A resistência eficaz da indústria de jogos

Enquanto engenheiros de software mergulharam nisso sem colete salva-vidas, a indústria de jogos vem resistindo com eficácia, liderada pelos consumidores
Vários jogos pediram desculpas e removeram conteúdo de IA não rotulado
A Steam tem uma política clara para conteúdo de IA, e o SteamDB oferece ferramentas para filtrar jogos gerados por IA
- Uma atualização recente da política da Steam passou a excluir usos de "ganho de eficiência" em ferramentas de desenvolvimento que não geram conteúdo apresentado ao jogador
Há dois motivos para o mercado de jogos resistir de forma eficaz:
- É um mercado de distribuição digital D2C puro (venda direta ao consumidor) — os gamers têm todo o poder de escolha, e os formadores de gosto que exigem transparência são os próprios jogadores
- A maioria dos jogos é artística e comprada justamente por um apelo artístico específico — na arte, imitação é vista como algo que reduz o valor do original e rouba crédito

O contraste entre reutilização de código e originalidade artística

Código, em geral, não é prejudicado pela reutilização e, no caso de infraestrutura, isso pode até ser benéfico
É por isso que projetos open source são particularmente inadequados para atrair criativos artísticos talentosos — o espírito de compartilhamento sem custo significa que o design artístico é imediatamente apropriado fora de contexto
A clássica geração procedural (procedural generation) merece atenção como precedente, e em geral não correspondeu às expectativas
- O caso de No Man's Sky (versão de 2016) — a promessa de criar conteúdo exponencial a partir de fontes limitadas acabou tornando sem valor a diversidade do próprio resultado

IA generativa, bibliotecas piratas e ambiguidade jurídica

É natural que artistas denunciem a IA generativa como plágio em massa, e também é natural que empreendedores de tecnologia e organizadores de dados não entendam isso e treinem modelos com bibliotecas-sombra piratas
- A Nvidia foi acusada de tentar negociar acesso de alta velocidade à vasta coleção de livros piratas do Anna's Archive
Há uma razão clara para que os resultados sejam medianos, toscos e suspeitos — a variedade das amostras de treino é, ela mesma, apenas slop para máquinas
Isso cria uma negação plausível (plausible deniability) em que é impossível distinguir o que é citação, o que é alucinação e o que é original
Colocar um rótulo de conteúdo gerado por IA ou marca-d'água em conteúdo de IA é, na maioria das vezes, apenas uma forma de evitar responsabilidade, não uma divulgação realmente responsável
Para que vibe-coding seja aceitável e justificável, seria preciso adotar a posição paradoxal de que a produção do próprio engenheiro é descartável, não criativa e não merece crédito

Atribuição de fonte (Source Attribution) como solução

Nenhum tribunal deveria ter decidido sobre a legalidade ou a possibilidade de copyright de toda a produção de IA de forma genérica; resultados sem fonte deveriam ser tratados como falsificação
A solução para o problema dos LLMs é clara, mas inalcançável: que o LLM faça atribuição correta da fonte junto com o raciocínio
- Isso revelaria, não só do ponto de vista artístico, mas também que boa parte do vibe code é copiar/colar de codebases existentes sem autor original, licença ou links
Nos modelos atuais, atribuição real é tecnicamente impossível — a própria capacidade do LLM de mencionar e citar fontes é uma propriedade emergente (emergent property) dos dados coletados
- O LLM só consegue citar fontes quando isso parece apropriado para a posição atual no texto, o que não passa de um role-play de citação (citation role-play): citar bem aquilo que costuma ser citado corretamente
As implicações de exigir atribuição são enormes: se os pesos precisam ser atribuíveis e o forward pass auditável, como seria o backpropagation? Certamente não caberia em int4
É exatamente esse o problema que as "ferramentas de detecção de IA" tentam resolver ao contrário
É paradoxal que a tecnologia seguinte à World Wide Web e a buscadores na escala do Google seja justamente uma tecnologia que, por design, não consegue informar a origem da informação
Se as máquinas quiserem parar de mentir, precisam citar corretamente suas fontes — e as empresas de IA também

3 comentários

hungryman 2026-03-06

O que é isso, minha capacidade de vocabulário está começando a falhar.
Estou aqui sentado pesquisando por "emergente, slop, atribuição de fonte, efeito de enquadramento, explosão cambriana".

GN⁺ 2026-03-06

Comentários do Hacker News

O mercado de videogames parece ser um caso raro em que consumidores reagiram contra IA, mas na prática houve reação apenas a assets de arte por IA
Ninguém liga se o código foi escrito por IA ou não. Pela pesquisa da Steam sobre IA, a geração de código já é permitida
No fim, a disseminação da programação com LLM é inevitável. O mesmo vale para geração procedural: depende mais da capacidade de quem usa do que da ferramenta em si
- Dizer que a geração procedural fracassou é uma visão ignorante. Há muitos casos de sucesso, dos clássicos como Elite e Powermonger até jogos roguelike recentes
- É verdade que LLM reduz código repetitivo, mas isso não é reutilização de código. Já era um problema que podia ser resolvido com bibliotecas
- Ver um amigo artista criticar IA e ao mesmo tempo usar IA em textos de marketing fez pensar nessa postura contraditória
- A pesquisa da Steam indica que isso inclui geração de código, mas no fim isso não é tão diferente de usar uma biblioteca
- O encanto dos jogos de mundo aberto diminuiu porque a novidade acabou. A alegação de que LLM economiza tempo também tem base fraca. Resultados imediatos não garantem ganhos de longo prazo
A discussão sobre LLM está ficando cansativa. Essa tecnologia está sendo usada mais para controlar do que para empoderar as pessoas, facilitar demissões e concentrar ainda mais riqueza
É como porcos debatendo a utilidade de uma máquina de bacon
- Por US$ 20 por mês, uma IA que qualquer pessoa pode usar já é uma ferramenta amplamente acessível. Na verdade, ela reduz barreiras. Parece mais reação de quem tem medo da mudança
- Essa lógica vem se repetindo desde a Revolução Industrial com toda tecnologia de automação
- A IA pode até nos libertar da dependência comercial. Podemos chegar a criar nosso próprio OS ou nossos próprios apps
- Devemos exigir automação total e renda básica garantida. Mais perigoso que AGI são as pessoas
- Se a maioria perder o emprego, o próprio mercado colapsa. Mas, por causa da concorrência, as empresas acabarão criando novos empregos
O movimento ludita não era simples antitecnologia. Eles se preocupavam com a queda de qualidade, e estavam certos
Os cachecóis de lã artesanais da Europa medieval eram completamente diferentes dos produtos de fábrica modernos. O avanço tecnológico nem sempre é uma substituição 1:1
Ainda hoje, ao ver ferramentas internas feitas por não técnicos economizando centenas de horas, fica claro que, mesmo sem perfeição, se funciona e gera efeito, já basta
- O Japão é uma sociedade industrializada, mas ainda respeita a tradição artesanal
- Daqui a 800 anos, o código que estiver em museus será apenas o código realmente bom. Existe um viés de sobrevivência que idealiza o passado
- Recomendo a palestra de Jonathan Blow Preventing the Collapse of Civilization
- Chamar engenheiros de software de luditas é errado. A maior parte da engenharia, na prática, é mais próxima de trabalho artesanal, repetitivo e baseado em experiência
- Querer voltar ao período pré-industrial é só nostalgia aristocrática. Pelo contrário, LLM abre ao público o acesso a software sob medida
O que LLM revelou é que a maior parte da programação é código boilerplate
O valor real está em pequenas inovações de nível mais alto
- Se velocidade de desenvolvimento fosse realmente importante, a estrutura organizacional já teria mudado. Na prática, o problema é a burocracia ineficiente
- Bibliotecas e abstrações acabam causando inchaço de código. Como LLMs aprenderam com esse tipo de código, é difícil gerar código limpo
- Até código repetitivo pode carregar espírito de artesanato. Construir bem a base também tem valor
- Antes, as etapas da programação eram divididas em “escolher o que fazer – escrever – depurar”, mas hoje isso parece anacrônico
- No fim, um livro também se parece com um artigo simples preenchido com centenas de páginas de boilerplate
O uso ideal de LLM é como professor. É melhor usá-lo como ferramenta para ensinar conceitos rapidamente, em vez de gerar código
- Agora é exatamente a hora para isso. Basta explicitar no prompt: “não escreva código, seja um bom professor”
- Mas aprender com um professor não confiável é uma experiência angustiante. Mesmo que seja mais lento, um aprendizado estável parece melhor
Como queijo ou presunto artesanal, talvez no futuro exista Artisanal Coding
- O ‘Handmade Network’ já pratica essa filosofia. LLM é apenas o ponto final do desenvolvimento de software industrializado
  Acabou virando uma máquina que transpõe especificações para código no lugar de humanos
- O caso mais próximo é o de gente como Steve Gibson, que escrevia assembly manualmente. Mas nunca foi uma corrente popular
- A lógica de proteger tradições como denominação de origem geográfica em geral tem fundamentação fraca
A realidade fria é que ninguém se importa com o nosso código em si
A maioria só liga para se funciona, quão rápido é e quanto custa. No fim, estamos mais para operários de fábrica
É parecido com a sensação de perda que um relojoeiro teria ao ver um torno automático
- Só se espantam quando ignoram a qualidade e o sistema desmorona por causa da dívida técnica
- Em software corporativo, “se simplesmente funciona já basta”, mas em produtos para o consumidor qualidade e acabamento importam
- Eu vejo código como dívida. Sinto prazer quando posso descartá-lo sem hesitar, quando ele deixa de ser necessário
- Programar não é criativo nem sexy. O mundo só quer saber se “funciona bem, é rápido, é barato e chega ao mercado antes do concorrente”
  No fim, a narrativa romântica do “trabalho criativo” que sustentávamos está desmoronando
Toda essa discussão no fim parece mais um problema da natureza humana, que se repete como o meme TTP(Time To Penis)
Este texto mostra uma visão realmente realista e equilibrada

parkindani 2026-03-06

Tanto o texto quanto os comentários estão surpreendentemente negativos. Será que ninguém aqui sequer já experimentou rodar o Claude Code..