- Um único arquivo Markdown que classifica, por categoria, padrões de escrita (tropes) que aparecem repetidamente em textos gerados por IA
- Ao adicionar este arquivo ao prompt de sistema de uma IA, é possível induzi-la a evitar estilos textuais típicos e batidos de IA
- Organiza mais de 30 padrões concretos, cada um com exemplos, sob 6 grandes categorias: escolha de palavras, estrutura de frases, estrutura de parágrafos, tom, formatação e composição
- Abrange desde vocabulário excessivo típico de IA, como "delve", "tapestry" e "landscape", até estruturas frasais que criam uma falsa profundidade, como "It's not X -- it's Y"
- Cada padrão pode ser aceitável se usado uma ou duas vezes, mas se torna um forte sinal de texto gerado por IA quando vários padrões aparecem ao mesmo tempo ou de forma repetida
- O próprio arquivo também foi escrito com ajuda de IA e inclui a ressalva: "IA para IA, humanos para humanos"
Escolha de palavras (Word Choice)
- "Quietly" e os advérbios mágicos: padrão de abusar de advérbios como "quietly", "deeply", "fundamentally", "remarkably" e "arguably" para dar uma importância sutil a descrições comuns
- Ex.: "quietly orchestrating workflows", "a quiet intelligence behind it"
- "Delve" e palavras semelhantes: termo que já foi um dos sinais mais famosos de texto gerado por IA, aparecendo com frequência anormalmente alta
- "certainly", "utilize", "leverage" (verbo), "robust", "streamline" e "harness" pertencem à mesma família
- "Tapestry" e "Landscape": padrão de usar substantivos grandiosos onde palavras simples seriam suficientes
- "tapestry" é abusado para qualquer coisa interconectada, e "landscape" para qualquer área ou domínio
- "paradigm", "synergy", "ecosystem" e "framework" também são do mesmo tipo
- Evitar "Serves As": uso de conectores exagerados como "serves as", "stands as", "marks" e "represents" no lugar do simples "is/are"
- Isso ocorre porque a penalidade de repetição da IA a empurra para construções mais vistosas em vez da cópula básica
Estrutura de frases (Sentence Structure)
- Paralelismo negativo (Negative Parallelism): padrão "It's not X -- it's Y", um dos sinais mais facilmente identificáveis da escrita por IA
- Embala tudo como uma reformulação surpreendente, gerando falsa profundidade
- Antes dos LLMs, não existia escrita em massa nesse formato
- Inclui também a variação causal "not because X, but because Y"
- "Not X. Not Y. Just Z.": padrão de contagem regressiva dramática em que duas ou mais coisas são negadas antes de revelar o ponto real
- Cria uma falsa sensação de que a verdade está sendo progressivamente afunilada
- "The X? A Y.": padrão de pergunta retórica seguida de resposta imediata, em que o texto faz uma pergunta que ninguém fez e a responde na sequência
- Usado para efeito dramático, como se a IA considerasse isso a essência da boa escrita
- Abuso de anáfora (Anaphora): repetição rápida da mesma abertura de frase várias vezes
- Ex.: "They assume that... They assume that... They assume that..."
- Abuso de tricolon (Tricolon): uso excessivo da regra de três, inclusive expandindo para quatro ou cinco itens
- Um tricolon pode ser elegante; três tricolons seguidos mostram falha de reconhecimento de padrão
- "It's Worth Noting": transição de preenchimento que não sinaliza nada de fato
- "It bears mentioning", "Importantly", "Interestingly" e "Notably" são do mesmo tipo
- Introduz um novo ponto sem realmente conectá-lo ao argumento anterior
- Análises superficiais (Superficial Analyses): anexar construções com particípio presente no fim da frase para injetar uma análise rasa
- Expressões como "highlighting its importance", "reflecting broader trends" e "contributing to the development of..."
- Atribuem importância, legado ou significado amplo a fatos banais
- Faixas falsas (False Ranges): construções "from X to Y" em que X e Y não estão de fato em uma mesma escala
- No uso legítimo, isso sugere um espectro com pontos intermediários significativos; a IA usa para apenas listar duas coisas vagamente relacionadas
- Litania de fragmentos em gerúndio (Gerund Fragment Litany): após uma afirmação, seguem-se vários fragmentos em gerúndio sem sujeito
- "Fixing small bugs. Writing straightforward features. Implementing well-defined tickets."
- A primeira frase já disse tudo, e os fragmentos só acrescentam contagem de palavras e o ritmo típico de IA
- Humanos não costumam redigir rascunhos assim; trata-se de um puro tique estrutural
Estrutura de parágrafos (Paragraph Structure)
- Fragmentos curtos e impactantes (Short Punchy Fragments): uso de frases muito curtas ou fragmentos como parágrafos independentes para criar ênfase artificial
- Resultado de treinamento com RLHF que empurra o modelo para uma "escrita para legibilidade" voltada ao menor denominador comum
- Um pensamento por frase, sem necessidade de manter estado mental: um estilo desumano
- Listicle disfarçado (Listicle in a Trench Coat): pontos numerados ou rotulados camuflados como prosa contínua
- Padrão de esconder o formato de lista em parágrafos que começam com "The first... The second... The third..."
- Muitas vezes adotado como alternativa depois que o modelo recebe instrução para não gerar listas
Tom (Tone)
- "Here's the Kicker": transição de falso suspense que promete uma revelação, mas entrega um ponto que não precisava de preparação
- "Here's the thing", "Here's where it gets interesting" e "Here's what most people miss" são do mesmo tipo
- "Think of It As...": modo professor por padrão, assumindo que o leitor precisa de uma analogia para entender qualquer coisa
- A IA frequentemente gera analogias menos claras do que o conceito original
- "Imagine a World Where...": convite futurista típico da IA, em que após "Imagine" vem uma lista de coisas ótimas que aconteceriam se você aceitasse a premissa
- Falsa vulnerabilidade (False Vulnerability): autoconsciência performática que quebra a quarta parede ou finge reconhecer vieses
- Vulnerabilidade real é específica e desconfortável; a da IA é polida e sem risco
- "The Truth Is Simple": padrão de afirmar que algo é óbvio ou simples em vez de realmente demonstrá-lo
- Inflação grandiosa de apostas (Grandiose Stakes Inflation): inflar o peso de todo argumento até uma importância quase civilizacional
- Quando um post de blog sobre preço de API vira uma meditação sobre o destino da civilização
- "Let's Break This Down": voz pedagógica que coloca até o leitor especialista em uma relação professor-aluno por padrão
- "Let's unpack this", "Let's explore" e "Let's dive in" são do mesmo tipo
- Atribuições vagas (Vague Attributions): atribuir afirmações a autoridades sem nome, como "experts", "observers" e "industry reports", sem fonte específica
- Inclui transformar a fala de uma pessoa em opinião amplamente difundida, ou inflar duas fontes para "several publications"
- Rótulos conceituais inventados (Invented Concept Labels): anexar substantivos abstratos de problema (paradox, trap, creep, divide, vacuum, inversion) a termos de domínio para criar rótulos compostos que soam analíticos, mas não têm base
- "supervision paradox", "acceleration trap" e "workload creep"
- Funcionam como atalho retórico: dão um nome e pulam a argumentação; quando vários aparecem no mesmo texto, são um forte sinal de AI slop
Formatação (Formatting)
- Vício em travessão (Em-Dash Addiction): uso compulsivo e excessivo de travessões para pausas dramáticas, incisos e viradas
- Um autor humano pode usar 2 ou 3 naturalmente em um texto; a IA usa mais de 20
- Bullets com negrito primeiro (Bold-First Bullets): padrão em que todo bullet point começa com uma expressão em negrito
- Muito comum na saída em Markdown de Claude e ChatGPT; quase ninguém formata manualmente assim
- Sinal claro de documentos, posts de blog e arquivos README gerados por IA, especialmente com emoji
- Decoração Unicode (Unicode Decoration): uso de caracteres especiais difíceis de digitar em um teclado padrão, como setas Unicode (→) e aspas tipográficas
- Autores reais costumam usar aspas retas e ->, => em editores de texto
- O Claude gosta particularmente da seta →
Composição (Composition)
- Resumos fractais (Fractal Summaries): aplicar "o que vou dizer, o que estou dizendo e o que acabei de dizer" em todos os níveis do documento
- Toda subseção, seção e o documento inteiro recebem seus próprios resumos
- Metáfora morta (The Dead Metaphor): fixação em uma única metáfora, repetida ao longo de todo o texto
- Um autor humano introduz a metáfora, usa e segue em frente; a IA a repete de 5 a 10 vezes
- Empilhamento de analogias históricas (Historical Analogy Stacking): especialmente comum em textos de tecnologia, com enumeração rápida de empresas históricas ou revoluções tecnológicas para construir falsa autoridade
- Padrões do tipo "Apple didn't build Uber. Facebook didn't build Spotify..."
- Diluição de um ponto (One-Point Dilution): reafirmar um único ponto de 10 maneiras diferentes ao longo de milhares de palavras
- Repetição da mesma ideia com analogias, exemplos e enquadramentos diferentes para parecer "abrangente"
- Duplicação de conteúdo (Content Duplication): repetir literalmente seções ou parágrafos inteiros dentro do mesmo texto
- Acontece quando o modelo perde o rastreamento do que já escreveu, especialmente em textos longos
- Sinal claro de saída de IA sem edição, embora hoje seja menos comum
- Conclusão sinalizada (The Signposted Conclusion): anunciar explicitamente a conclusão com "In conclusion", "To sum up" ou "In summary"
- Uma escrita habilidosa faz o leitor sentir a conclusão sem precisar avisar
- Como segue templates, a IA sinaliza movimentos estruturais
- "Despite Its Challenges...": fórmula rígida em que a IA reconhece problemas, mas os descarta imediatamente
- Segue sempre o mesmo compasso: "Despite its [palavra positiva], [sujeito] faces challenges..." e depois "Despite these challenges, [conclusão otimista]"
Princípio central
- Os padrões acima podem ser aceitáveis se usados uma vez, mas se tornam problemáticos quando vários aparecem juntos ou quando um mesmo padrão se repete
- Escreva como um humano: variado, imperfeito e específico
7 comentários
"Neste texto, o autor disseca um texto gerado por IA e expõe os 6 principais sinais de 'AI slop' e a estrutura oculta por trás deles. Não se trata apenas de uma lista de palavras. Do vocabulário excessivamente rebuscado, como "delve" e "tapestry", aos padrões de frase que criam uma falsa profundidade, o texto aborda por que isso não soa como escrita humana. O ponto central está em recuperar uma escrita diversa e imperfeita."
Parece que até no NamuWiki tem um verbete relacionado hahaha
https://namu.wiki/w/…
Na época em que eu escrevia minha dissertação de mestrado em LaTeX, aprendi pela primeira vez a diferença entre em dash (---) e en dash (--), e desde então tenho usado ambos com frequência em quase todos os textos que escrevo em inglês. (uso com atalho configurado no Espanso)
Até agora nunca ouvi algo como "você escreveu isso com IA?", mas mesmo assim fico com sentimentos mistos ao saber que um sinal de pontuação de que eu gosto tanto está sendo usado como indicador de IA.
Leitura relacionada: https://marcusolang.substack.com/p/im-kenyan-i-dont-write-like-chatgpt
Pelo que vi, é um texto que já tinha aparecido no GeekNews: 나는 케냐인이다. 나는 ChatGPT처럼 쓰지 않는다. ChatGPT가 나처럼 쓴다
Uau... você realmente, **foi direto ao ponto.**Ah, seria ótimo se também saísse uma versão em coreano.
Comentários do Hacker News
Se você quer compartilhar um texto de forma séria, deve evitar usar esse tipo de prompt
Tentei escrever posts de blog com LLM e, no começo, até parece bom, mas depois de algumas repetições todos os textos passam a soar com a mesma voz
O mesmo tom se repete em outros blogs, notícias e white papers
Os leitores querem ouvir não só o conteúdo do texto, mas também a voz própria do autor
Texto relacionado: Why We Hate LLM Articles
O problema da escrita com AI é que ela não tem “voz”
Um escritor humano apresenta uma perspectiva vinda da própria experiência, mas a AI não tem intenção de “dizer” nada
Além disso, ela não consegue manter uma coerência profunda. Parece ser um problema decorrente da falta de objetivos humanos, memória e senso de identidade
Esse tipo de tentativa parece desagradável
Em vez de tentar esconder de forma esperta frases escritas por AI, seria melhor simplesmente não desperdiçar o tempo dos outros
Se você não tem vergonha de escrever com AI, não precisa esconder; se tem vergonha, deveria parar
Se reclamam de um poço envenenado, a resposta certa não é usar um veneno ainda mais sofisticado
Estou pesquisando o estilo de escrita dos LLMs, e entre as expressões desta thread “tapestry” me chamou a atenção
Era a palavra mais frequente do GPT-4o depois de “camaraderie”
O modelo base tem menos desse estilo estranho, mas isso aparece depois do instruction tuning
Fico curioso se fazem avaliadores humanos julgarem o estilo, ou se existe alguma rubrica para isso
Artigos relacionados: artigo da PNAS, pré-publicação no arXiv
Pesquisas do Quênia e da Nigéria mostram que, como a perplexity é o objetivo de otimização, o modelo pré-treinado reflete as saídas mais “previsíveis”
Também inclui o texto “Hydrogen Jukeboxes”
A mudança de estilo também aparece na análise de mode collapse de Gwern Branwen
Mesmo modelos com quase nenhuma preferência humana, como o DeepSeek R1 Zero, acabam convergindo para padrões estáveis
Esse fenômeno se repete de geração em geração, e a web vai sendo contaminada com a produção dos modelos anteriores, criando um ciclo vicioso
Por exemplo, acho interessante a tokenização de “camaraderie” ou o fato de que, no inglês, emoji é praticamente o único pictograma, o que aumenta seu peso relativo
Esse tipo de lista corre o risco de ficar cada vez maior com o tempo
Porque a AI continua criando novos clichês
Esse arquivo parece mais um documento para mim, usuário, do que para um LLM
Dizer “adicione este arquivo ao system prompt da AI” acaba virando uma instrução da AI para a própria AI
Como há explicações misturadas, isso fica confuso. Expressões como “não faça isso” podem ter o efeito contrário de fazer a palavra aparecer mais
É preciso separar a explicação para usuários das instruções para a AI
Pedi ao Claude para reescrever e organizei neste gist
Para um LLM, é mais eficaz evitar esses nomes e explicar a forma positiva de uma boa frase
A versão reescrita pelo Claude está aqui
Dizer “não faça isso” acaba produzindo um efeito Streisand e fazendo justamente isso acontecer mais
Pedir para escrever no estilo de um autor específico tende a gerar um resultado mais natural e menos genérico
Depois, colocar um “agente de edição” para remover clichês melhora muito o resultado
Tentei fazer uma pesquisa histórica com o Gemini, mas ele não conseguia parar de usar metáforas de tecnologia
Comparava senhores feudais a CEOs, o papa a um influencer, e rebeliões feudais a entrevistas de emprego, a ponto de ficar quase cômico
Dá para adicionar instruções extras nas configurações, mas quando coloquei minha stack tecnológica, toda resposta passou a terminar com a frase “JVM e v8 resolvem isso”
Aí mandei ignorar isso, e então ele começou a acrescentar parágrafos em tom sarcástico, começando com “Para um cérebro de mestrado como o seu...”
Claude e ChatGPT andam usando muito palavras como “genuine”, “real”, “honest”
Expressões como “no <thing you told me not to do>” também aparecem bastante. Parece ser uma forma de verificar adesão ao prompt
A Wikipédia também tem material relacionado: Signs of AI Writing
Só que, ao ler, você acaba reconhecendo hábitos da sua própria escrita e fica meio sem graça
Eu uso bastante expressões de falso intervalo, como “from X to Y”
E o LLM nunca consegue abandonar a mania de separar título e subtítulo com dois-pontos
Como material útil escrito por humanos, recomendo Wikipedia: Signs of AI Writing