Por que a escrita por IA é banal e entediante: ablação semântica

(theregister.com)

3 pontos por GN⁺ 2026-02-19 | 2 comentários | Compartilhar no WhatsApp

Ablação semântica (Semantic ablation) é um fenômeno de erosão algorítmica em que a IA remove gradualmente a densidade semântica própria de um texto
Isso é um subproduto estrutural de greedy decoding e aprendizado por reforço com feedback humano (RLHF), levando ao abandono de expressões raras e precisas em favor de uma linguagem mediana
O ajuste da IA para “segurança” e “utilidade” reforça essa tendência, suprimindo intencionalmente atritos linguísticos atípicos e causando o corte da intenção e da individualidade
Quanto mais um texto é refinado repetidamente por IA, mais a diversidade vocabular (type-token ratio) cai abruptamente, enquanto metáforas, termos técnicos e estruturas lógicas vão sendo progressivamente achatados
Como resultado, a complexidade do pensamento humano é sacrificada em nome de uma estética algorítmica da “fluidez”, e a sociedade como um todo está caindo em uma “corrida para o meio”

Conceito de ablação semântica (Semantic ablation)

Ablação semântica significa erosão algorítmica de informação de alta entropia (high-entropy)
- Não se trata de um erro, mas de um produto estrutural do greedy decoding e do processo de RLHF
- Para maximizar probabilidades, o modelo converge para o centro de uma distribuição gaussiana, descartando tokens raros, precisos e complexos
Esse fenômeno se intensifica à medida que desenvolvedores reforçam os ajustes de “segurança” e “utilidade”
- Ao considerar o atrito linguístico atípico como “risco”, ocorre um corte semântico não autorizado
- Como resultado, na busca por baixa perplexidade (perplexity), acontece a destruição de sinais distintivos

O processo de erosão na escrita por IA

O processo em que a IA “refina” um rascunho é, na prática, descrito como a execução da ablação semântica
- A IA identifica áreas de alta entropia, ou seja, as partes que contêm insights originais, e as substitui pelos tokens genéricos mais prováveis
- A precisão áspera do texto original desaparece, sendo trocada por uma casca fluida, porém vazia
Esse fenômeno pode ser medido como decaimento de entropia (Entropy Decay)
- Quanto mais o texto é refinado repetidamente por IA, mais a diversidade vocabular (type-token ratio) entra em colapso
- Como resultado, surge o processo de 3 etapas da ablação semântica

As 3 etapas da ablação semântica

Etapa 1: limpeza metafórica (Metaphoric cleansing)
- A IA trata metáforas atípicas ou imagens sensoriais como “ruído” e as substitui por expressões seguras e banais
- O atrito emocional e sensorial é removido
Etapa 2: achatamento lexical (Lexical flattening)
- Termos especializados e vocabulário técnico preciso são sacrificados em nome da “acessibilidade”
- Tokens raros (1/10.000) são trocados por sinônimos comuns (1/100), diluindo a densidade semântica e a gravidade lógica
Etapa 3: colapso estrutural (Structural collapse)
- Lógicas complexas e não lineares são forçadas a assumir estruturas previsíveis de baixa perplexidade
- Implicações e nuances são removidas, restando apenas uma casca intelectualmente vazia, embora gramaticalmente perfeita

Resultados e analogias

Esses resultados são descritos como um “JPEG do pensamento”
- À primeira vista parecem consistentes e fluidos, mas a densidade dos dados originais e o significado foram perdidos
Se a “alucinação (hallucination)” é o erro de inventar o que não existe, a ablação semântica é o processo de destruir o que existe
- A complexidade do pensamento humano é sacrificada no altar da fluidez algorítmica
- A sociedade está caindo cada vez mais em uma “corrida para o meio (race to the middle)”, construindo um mundo gramaticalmente correto, porém vazio

Alerta e conclusão

Se aceitarmos resultados de IA sem reconhecer a ablação semântica, acabaremos normalizando a deterioração do significado
Se essa erosão continuar, há o risco de esquecermos até mesmo o que é “substância”
Por isso, é importante nomear e tomar consciência do conceito de ablação semântica

2 comentários

mammal 2026-02-19

Dá para considerar que deixar erros de digitação de propósito ou escrever em minúsculas para não parecer um texto escrito por IA é um ato de aumentar deliberadamente a entropia.

GN⁺ 2026-02-19

Opiniões do Hacker News

Parece captar bem algo em comum que muita gente sente ao rejeitar sugestões de reescrita de frases feitas por IA
Quanto mais a IA lapida uma frase, mais o fio do texto desaparece, e no fim ele acaba não dizendo nada
A individualidade humana some e vira um estilo liso, mas sem graça
Só que são justamente essas arestas ásperas, essas expressões inesperadas, que despertam a atenção do leitor e fazem a ideia penetrar fundo
- Acho que isso depende do nível de habilidade de quem escreve
  Muita gente não escreve bem, então a IA produz frases mais claras e sem erros
  Mas esse tipo de texto nunca será grandioso
  Mesmo quando tenta imitar o estilo de um escritor famoso, sempre soa meio estranho em algum ponto
- Acho que a IA é, por natureza, uma ferramenta para tarefas rotineiras
  Ela pode tornar partes chatas, como e-mails, mais eficientes, mas o que realmente interessa acontece nas “bordas”
  A escrita comum pode ser automatizada, mas a expressão criativa continua sendo território humano
- Tenho a impressão de que o estilo produzido por IA se parece com fala de gerente
  Quando falta domínio técnico, ele vai sendo preenchido com palavras vagas, jargões e metáforas
  Talvez seja por isso que líderes e políticos gostem de conteúdo gerado por IA
- O motivo de textos de IA serem sem graça não é por serem “perfeitos demais”, mas por uma obtusidade artificial
  Há repetição demais, frases desnecessárias demais e pouca capacidade de formular algo específico
- Resumindo em uma linha: Mediocrity as a Service
Ao montar vários pipelines multi-agent, observei um fenômeno interessante
Depois de passar por quatro etapas — “resumo → expansão → revisão → polimento” —, a partir da terceira todas as frases passam a ter o mesmo ritmo e o mesmo vocabulário
Mesmo mantendo referência constante ao texto original, havia um limite
A causa está na própria estrutura do RLHF (aprendizado por reforço com feedback humano)
Como se favorecem expressões “claras, seguras e inofensivas”, frases surpreendentes acabam sendo penalizadas
No fim, o modelo converge para resultados medianos
O modelo-base é muito mais estranho e criativo, mas o modelo ajustado remove deliberadamente a individualidade
Por isso, quando o RLHF já foi aplicado com força, é difícil resolver isso só com prompt
Em vez disso, separo as tarefas: coisas em que a “voz” precisa ser preservada vão para modelos menos ajustados, enquanto extração estrutural ou classificação ficam com modelos com RLHF
- Perguntando com sinceridade: este comentário também foi escrito com LLM?
  De qualquer forma, concordo com a análise
- Fico curioso se daria para preservar a individualidade injetando ruído em cada etapa intermediária
  Embora talvez fosse difícil manter a individualidade própria do texto original
- Mesmo removendo o RLHF, fico em dúvida se seria possível manter útil um resultado que se desviasse da média
  No fim, talvez seja um problema difícil de resolver só com LLM
Hoje em dia dá para ouvir a voz da IA por toda a internet
Blogs, notícias, obituários e YouTube: tudo tem um tom parecido
Às vezes até imitam a voz de físicos famosos
Pessoalmente, isso me deprime, como se a alma estivesse sendo drenada
- Na verdade, até este próprio texto parece ter esse cheiro de IA
- Estou desenvolvendo uma rejeição cada vez mais instintiva
  Como os artefatos de compressão JPEG de 1993, agora isso começou a saltar aos olhos
- Acho que é a pior mudança que aconteceu na internet desde feeds viciantes e anúncios
  E, por causa do efeito fundador, nem parece que vai surgir uma nova internet
- No momento em que reconheço os padrões de estilo da IA, minha concentração vai embora por completo
  Não sei se sou sensível demais ou se o texto realmente é ruim
- Agora tenho gostado mais de atividades offline do que online
  A internet está tão coberta de lixo sintético que eu nem quero mais olhar
Acho que o próprio termo “Generative AI” está errado
Quanto mais entendo os princípios matemáticos de machine learning, mais sinto que isso não deveria ser usado para gerar conteúdo destinado a pessoas
Às vezes sai algo aceitável por sorte, mas na maior parte do tempo é só o equivalente a uma pessoa tentando à força parecer criativa numa festa chata
Como ferramenta para ajudar na criação, é útil, mas não acredito que consiga produzir resultados criativos por conta própria
- As pessoas querem o real
  Dá até mais vontade de ler o prompt original do que esses tokens artificiais
- Em uma frase: Regurgitative AI, ou seja, IA regurgitativa
- Seria melhor se as empresas focassem nas áreas em que a IA realmente pode ser útil, como assistência em busca ou automação de código
  Mas, na prática, o que temos é produção em massa de agentes espaguete para inflar preço de ação
- A expressão “a fala da pessoa mais entediante do mundo” é tão certeira que dá vontade de rir
  Em outras palavras, Median AI à la mode
Fiquei muito impressionado com a expressão “high entropy” usada pelo estudioso bíblico Dan McClellan
No vídeo do YouTube,
ele cita a frase “they rang the tuning fork that resounded in the loins of their dogmatism”,
e sinto que a IA jamais conseguiria produzir algo assim
- Mas essa frase também soa um tanto como salada de palavras
  Talvez num estilo de nível GPT-2 isso até parecesse mais natural
- A IA jamais usaria palavras como “loins” ou “dogmatism”
  Porque são palavras sexuais demais ou ruins para marketing
- Essa metáfora parece um tanto como uma metáfora misturada
- Na verdade, modelos como Claude às vezes conseguem criar metáforas extravagantes se o prompt for bem feito
  Por exemplo, se você pedir algo como “misture o estilo de Jim Thompson e Thomas Harris e escreva com a sensibilidade pulp de uma livraria de parada de caminhões de 1967”, sai coisa bem decente
  Claude é melhor nisso do que o ChatGPT, nesse tipo de estilo exagerado
  No fim, se os textos da web soam todos parecidos, não é por causa do HTML, e sim porque as pessoas não souberam usar HTML direito
Passei por algo parecido
Escrevi a landing page do meu novo estúdio de forma emocional e depois joguei no Grok, e toda a individualidade sumiu
Expressões ásperas são justamente o que transmite a alma do conceito
Então hoje uso IA só para checar ideias
- Eu também tentei usar LLM para geração de ideias, mas o resultado foi péssimo
  Pedi para criar o enredo de uma campanha de Dungeon World e só vieram configurações banais e sem sentido
  Em compensação, foi útil para resumir relatos de sessões e transformá-los em uma narrativa interessante
  O ChatGPT tende a gostar de um tom meio brincalhão, mas, com edição, dá para chegar a algo bem legível
  No fim, enredos criativos ainda precisam ser feitos por humanos
- Se você aceita ideias de IA como estão, ocorre uma simplificação metafórica e um achatamento do vocabulário
  Há o risco de passar a entender conceitos em formas distorcidas
  Para encontrar novos termos isso é útil, mas, para compreender um conceito em profundidade, acho muito melhor buscar diretamente materiais escritos por humanos
Gostei muito do conceito de “Semantic ablation”
Da próxima vez que eu quiser explicar por que o e-mail estilo ChatGPT de alguém é ruim, vou usar isso
Por esse motivo também sou cético com a ideia de que modelos como Opus 4 chegarão a ser AGI
No fim, mesmo soltando vários agentes, tudo vai convergir para um mingau homogêneo e sem sentido
- Sou grato por me dar uma linguagem para expressar esse ponto de vista
A geração de imagens parece uma espécie de anti-semantic ablation
Você começa com uma tela em branco e vai convergindo para pixels cada vez mais significativos
Fico curioso se, na geração de linguagem, seria possível fazer algo parecido e evoluir gradualmente para frases com opiniões mais nítidas
Se fosse possível medir o grau de ablação semântica de uma frase gerada, talvez desse para criar um agente em loop para reduzi-la
Assim, talvez desse para descobrir novas conexões ainda não encontradas nos dados de treinamento
Claro que o resultado também pode acabar sendo só alguém gritando
Para quem ainda não viu, recomendo a página da Wikipédia sobre sinais de escrita por IA
Originalmente ela é um guia para detectar contribuições de IA,
mas também serve como uma boa referência para perceber que você mesmo comete os mesmos erros ao escrever e corrigi-los