O contrato social da escrita
(jola.dev)- A escrita com LLM se espalhou por blogs, redes sociais, jornais, livros, correção ortográfica e até criação de rascunhos, e seu estilo repetitivo faz os textos parecerem um slop homogêneo
- Ao dedicar tempo para ler um texto, o leitor espera que o autor também tenha dedicado esforço intelectual, e o uso de LLM abala essa expectativa independentemente da qualidade do resultado
- O Oxide RFD 576 argumenta que a crença de que o autor realmente entendeu e escreveu o texto justifica o esforço do leitor para compreendê-lo, e que a prosa gerada por LLM prejudica esse contrato social
- Desde o ChatGPT, o texto gerado influencia a fala e o estilo humanos mesmo sem ser escrito diretamente, algo visível no aumento do uso de palavras como “delve”, “realm” e “meticulous”
- O critério de boa escrita está migrando da perfeição gramatical e lexical para a expressão original e os traços humanos, e até erros de digitação podem se tornar um sinal que diferencia textos de IA
Escrita com LLM e o contrato social
- Os LLMs se espalharam por vários setores, mas especialmente na escrita, sendo amplamente usados em blogs, redes sociais, jornais, livros, correção ortográfica, gramática, checagem de fatos e elaboração de rascunhos completos
- Eles são fortes na produção de grandes volumes de conteúdo, mas, quando se começa a reconhecer os idiomatismos e padrões de estilo característicos dos LLMs, a mesma sensação repetida aparece por toda parte
- Expressões como “it’s not x, it’s why”, travessão longo e “you’re not imagining it, the problem is real” se repetem, e os textos vão sendo homogeneizados no mesmo slop
- O leitor sente forte rejeição no momento em que percebe que dedicou tempo à leitura, mas o autor não dedicou um tempo equivalente
- Essa rejeição não desaparece mesmo quando o conteúdo está correto, foi bem pesquisado e o texto em si é razoável
A provocação do Oxide RFD 576
- A seção 2.4, “LLMs as writers”, do Oxide RFD 576 argumenta que a prosa gerada por LLM prejudica o contrato social da escrita
- Sem LLM, vale a premissa de que, entre leitor e autor, o autor dedicou mais esforço intelectual
- O leitor só tem motivo para se esforçar para entender frases e ideias difíceis quando pode acreditar que o autor compreendeu aquilo e escreveu por conta própria
- Quando se escreve com LLM, independentemente da qualidade do texto ou da precisão do conteúdo, o esforço despendido pelo autor para produzir o conteúdo diminui
- O problema central não é apenas a qualidade do resultado, mas o fato de o próprio uso do LLM, em vez de escrever diretamente, já violar o contrato social
A influência inevitável do texto gerado
- Mesmo sem usar LLM diretamente, a enxurrada de texto gerado afeta a fala e a escrita humanas
- Expressões como “you’re absolutely right” são usadas para zombar dos LLMs, mas a própria ferramenta também está mudando sutilmente os hábitos linguísticos humanos
- Um estudo do Max-Planck Institute for Human Development analisou que palavras preferidas pelo ChatGPT passaram a aparecer com mais frequência também na fala humana
- Entre as palavras em alta estão delve, realm, meticulous, adept, boast, swift, comprehend
- Os resultados da IA generativa já se espalharam por todo o ambiente linguístico, independentemente de terem sido usados diretamente ou não
A analogia com o aço de baixo ruído de fundo
- Low-background steel é o aço produzido antes da primeira explosão de bomba atômica, um material que em certo momento foi mais procurado para usos específicos
- Os diversos testes nucleares das décadas de 1940 e 1950 aumentaram a quantidade de material radioativo na atmosfera, e o aço produzido depois disso passou a ser considerado insuficientemente “limpo” para algumas aplicações, como detectores de partículas
- No entanto, hoje a radiação de fundo artificial global caiu, e o aço produzido recentemente parece poder ser usado na maioria das finalidades
- Nessa analogia, textos escritos depois de 30 de novembro de 2022 são considerados, em algum grau, influenciados por LLMs, por terem sido escritos após a disseminação do ChatGPT
- A menos que se leia apenas conteúdo antigo, é difícil evitar completamente o ambiente linguístico pós-LLM
Os critérios de escrita após os LLMs
- Quanto mais o conteúdo gerado ocupar a internet, maior será a demanda por pensamento e expressão originais, tanto de indivíduos quanto de empresas de modelos
- A capacidade de escrever conteúdo original sem LLM pode se tornar mais valiosa
- Porém, em um ambiente cheio de textos de thought leadership ao estilo LinkedIn e imagens de gatos geradas por IA, fica mais difícil encontrar esse tipo de escrita
- Durante muito tempo, os humanos consideraram boa gramática, vocabulário amplo, expressões e metáforas adequadas e estrutura sólida como critérios de boa escrita
- Os LLMs em geral atendem a esses critérios tradicionais, mas repetem os mesmos padrões, as expressões parecem gastas, as metáforas soam um pouco deslocadas, e o travessão longo deixa uma impressão ruim
Mudança nos critérios de boa escrita
- Hoje, um estudante pode escolher entre se esforçar para obter uma nota mediana ou não fazer nada e receber nota alta com um trabalho escrito pelo ChatGPT
- É plausível dizer que, se um texto escrito pelo Claude fosse mostrado a alguém de 10 anos atrás, essa pessoa não encontraria muitos pontos para reclamar
- Textos de LLM revelam repetição quando lidos por muito tempo, mas ainda se encaixam bastante bem nos critérios tradicionais de escrita “correta”
- Agora, o valor mais importante está migrando para a expressão original
- Mesmo com erros gramaticais, se for diferente há valor; mesmo com vocabulário limitado, se evitar as palavras repetitivas dos LLMs, o texto parece mais humano
- Erros de digitação já não são apenas defeitos simples, podendo ser aceitos como traços humanos que distinguem o texto da IA, sem graça e generalizado
A promessa de escrever sem LLM
- O contrato social só se estabelece quando, assim como o leitor dedica tempo para ler, o autor também dedica tempo para escrever
- Um texto escrito ao longo de boa parte do dia, com um filme antigo passando ao fundo, contém um esforço correspondente ao tempo do leitor
- Escrever é uma atividade prazerosa e algo feito ao longo da vida inteira, ainda que com diferentes níveis de constância
- Há a intenção de tornar a escrita uma rotina mais cotidiana daqui para frente, por ser algo visto como significativo e que vale a pena
1 comentários
Comentários do Lobste.rs
Esta frase do RFD da Oxide parece uma versão do meme ai;dr menos afiada e menos fácil de citar, mas muito mais explícita
A frase “quando não há LLM, presume-se que, entre o leitor e o autor, foi o autor quem fez o maior esforço intelectual” no fim quer dizer: “se você não teve o trabalho de escrever, eu também não vou ter o trabalho de ler”
Não se percebe expertise em autores que enfiam LLM no trabalho
Todo esse cheiro de LLM parece estar gritando em alto e bom som: “sou um incompetente que não pretende fazer o próprio trabalho”. Em software, dá até para defender que resultados consistentes, previsíveis, tediosos e de baixa variância são bons, mas em escrita, no geral, acho que é o contrário
Na verdade, acho que precisamos de uma escrita mais consistente, previsível e tediosa. A maior parte das orientações de escrita prioriza estilo acima de clareza e verdade. Não estou tentando defender escrita com IA, não uso IA diretamente para escrever e também odeio esse cheiro, mas gostaria que mais autores humanos tivessem coragem de ser tediosos
O mesmo vale para pull requests. Antes, a maior parte do esforço entrava em pensar profundamente no problema e escrever o código
Revisão também podia dar trabalho, mas pelo menos havia equilíbrio, e quando havia desequilíbrio era porque a revisão também servia como onboarding ou formação. Se você se importa com a qualidade do projeto, agora a equação mudou completamente. Pessoas sem qualquer interesse real no projeto podem despejar PRs várias ordens de grandeza mais rápido do que dá para revisar
Uma bênção, na verdade. Em revisão de código, ainda existe a vantagem de poder barrar PRs de novos contribuidores com sistemas como
vouch. Mas no caso de posts de blog, você fica sempre se perguntando se o autor realmente entendeu e se importou, ou se acabou de bater em mais uma parede de slop. Por enquanto o slop ainda é fácil de reconhecer, mas isso provavelmente vai mudar quando os produtores começarem a instruir os modelos a evitar os padrões típicos. O único slop que me agrada é o LinkedIn transbordando de comentários slopAntes já era lixo de autoengrandecimento, e depois continua sendo lixo de autoengrandecimento. Só que agora com imagens de IA em estilo cartunesco incluídas
Basicamente, qualquer coisa criada antes de 2022 me parece muito menos suspeita. Quem entende do assunto anda usando
before:2022em buscas de imagemAo ler um post de blog, o contrato social mais importante é que o autor vai melhorar sua escrita dali para frente por meio dessa experiência
O uso de LLM também quebra isso. Dá para discutir o uso de LLM para escrever código, mas usar LLM especialmente para escrever posts de blog é simplesmente nojento
Isso colocou muito bem em palavras pensamentos e sentimentos que venho carregando há um tempo. Especialmente esse desejo pela imperfeição do toque humano
Quero isso nos outros, e quero que a minha humanidade também apareça no meu trabalho. Sou muito ruim de ortografia, então amigos e colegas vivem tirando sarro de mim, e já pensei seriamente em deixar alguns erros de propósito em posts de blog para mostrar que ainda sou humano. Claro, talvez isso já seja um pouco demais
Concordo totalmente com a ideia de que “gosto de escrever, faço isso a vida toda, e agora estou tentando fazer isso de forma mais rotineira. Parece algo significativo e que vale a pena”, mas tenho dois medos
Primeiro, quando vejo alguém que por acaso começou um blog em 2024/2025 ou passou a publicar mais por volta dessa época, por padrão já classifico e arquivo como IA. Meu blog também vai parecer isso visto de fora. Segundo, não me agrada que meus textos ajudem empresas de IA a criar modelos melhores. Ainda assim, hipocritamente, eu também uso IA todos os dias
No segundo problema, não enxergo muito bem como matar tantos Golias. No primeiro, eu queria que surgisse algum tipo de prova de trabalho humano que demonstrasse que houve atenção humana suficiente por trás do conteúdo. Já pensei em fazer streaming no Twitch enquanto escrevo, mas isso é irreal demais, e expor o processo de escrita — incluindo ideias bobas, percepções de que “o que estou escrevendo agora está completamente errado” e reformulações intermináveis para acertar o tom — na verdade me parece constrangedor. Não consigo pensar em outro jeito de provar isso
Neste momento estou escrevendo um post técnico de blog bastante complexo, e todas as frases do corpo do texto estão sendo escritas manualmente
Precisei de várias tentativas para chegar ao que queria dizer, mas agora a estrutura parece estar bem boa. A parte em que usei Claude como ferramenta foi para transformar explicações em texto em diagramas Mermaid. Sou grato pelo esforço colocado no Mermaid, mas sinto que parte da sintaxe é complicada demais, especialmente fora de estruturas padrão como fluxogramas ou diagramas de sequência. Trabalho na Oxide e também dei alguma opinião no RFD 576