- O estilo formal de inglês moldado pelo sistema educacional do Quênia vem sendo repetidamente apontado como algo que parece texto gerado por IA
- O treinamento estrutural do ensino de redação em inglês enfatiza equilíbrio das frases, fluxo lógico e uso de conectivos, produzindo resultados semelhantes à escrita de IA
- Esse estilo é um legado do ensino de inglês britânico da era colonial e foi mantido como símbolo de status social e instrução
- Aponta-se o problema de viés em detectores de IA e modelos de linguagem, que julgam textos de não nativos como ‘não humanos’
- Enfatiza-se que o que se revela na escrita não é uma máquina, mas o produto de história, educação e identidade linguística
O mal-entendido entre IA e escrita humana
- O texto parte da experiência do autor ao receber o feedback de que sua proposta “parecia ter sido escrita pelo ChatGPT”
- Seu estilo foi avaliado como ‘pouco humano’ por ser estruturado e lógico
- Muitos escritores passam por reações semelhantes, e isso se conecta a preconceitos contra autores não nativos
- O autor explica que sua escrita se parece com a IA porque a IA aprendeu com os modos de ensino deles
A formação do ensino de inglês no estilo queniano
- A prova de redação em inglês do KCPE (Certificado de Educação Primária do Quênia) é o núcleo do treinamento de escrita
- Para obter nota alta em uma prova de 40 pontos, é preciso dominar vocabulário rico e estruturas frasais complexas
- As regras de redação se resumem em três pontos
- Começar com um provérbio ou uma frase forte, usar vocabulário variado e manter uma estrutura perfeita
- O professor desempenha o papel do ‘algoritmo original’ que corrige gramática e estrutura com caneta vermelha
- Esse treinamento enfatiza a construção de frases lógicas e equilibradas e continua no ensino médio e na universidade
Legado colonial e hierarquia da linguagem
- O ensino de inglês no Quênia se origina do sistema linguístico do Império Britânico
- Valoriza-se a correção gramatical e a formalidade com base no ‘Queen’s English’
- Mesmo após a independência, essa língua foi mantida como idioma oficial e símbolo de status social
- Falar um inglês refinado tornou-se um critério para distinguir nível educacional e classe social
- Como resultado, o vasto repertório de escrita formal aprendido pela IA acabou assumindo uma forma semelhante ao produto do ensino de inglês queniano
Viés e limites dos detectores de IA
- Detectores de IA classificam textos com base em ‘perplexity’ (previsibilidade) e ‘burstiness’ (variação no comprimento das frases)
- Estruturas frasais previsíveis e ritmo constante são considerados não humanos
- No entanto, o ensino queniano justamente toma como ideal esse estilo previsível e equilibrado
- Pesquisas mostram que esses detectores têm alta probabilidade de classificar erroneamente textos de não nativos como gerados por IA
- Isso revela um viés técnico que exclui a diversidade linguística
Redefinindo humanidade e linguagem
- A escrita de autores quenianos é resultado de educação, história e cultura, não de máquinas
- O texto critica a realidade em que o padrão de ‘escrita humana’ fica restrito a expressões informais e de estilo americano
- Escritores de Nairóbi, Lagos e Mumbai também compartilham tradições de escrita que valorizam precisão e lógica
- Julgar que algo “parece IA” é um olhar incapaz de reconhecer outras formas de humanidade
- A conclusão do texto encerra com a declaração de que esta é a escrita de um queniano, um modo que existe há muito tempo
2 comentários
Comentários do Hacker News
Nossa geração aprendeu regras não escritas da escrita transmitidas de professor para aluno
A primeira frase tinha que começar com um provérbio ou uma frase impactante, e era preciso usar expressões como
strode purposefullyem vez de palavras comunsMas, ao estudar escrita na universidade, isso foi gradualmente sendo substituído por frases simples e expressões curtas
Hoje, o estilo de Hemingway parece o ideal. O estilo floreado do ChatGPT, ao contrário, dá uma sensação de cansaço
Reconheço a habilidade do autor, mas prefiro textos simples e claros
A obsessão por escrever frases curtas estragou a prosa em inglês
Para a maioria das pessoas, simplicidade ajuda, mas o problema é tratar frases longas, ponto e vírgula e vocabulário mais sutil como “má escrita”
Essa atitude bloqueia o crescimento tanto do leitor quanto do escritor
Dito isso, expressões como
proceeded tocontinuam sendo lixo. Obrigar alunos a usar palavras para “parecer inteligentes” é uma das piores formas de ensinoMinha esposa é escritora, e diz que a palavra
strodeaparece com frequência anormal em fanfics e romances. Escrever que todo mundo “caminhou com firmeza” cada vez que anda é um traço comum de amadoresHá sinais de classe escondidos no estilo de escrita
Como o artigo diz, o inglês que aprendemos era o
Queen’s Englishda era imperialista, a linguagem do poderAprender a forma elegante da escrita não era apenas para passar em provas, mas para provar que se era uma “pessoa civilizada”
As modas da escrita se parecem com o ciclo da moda na sociedade. Quando um estilo floreado se populariza, a elite passa a se diferenciar com um estilo simples
O estilo contido de Hemingway é como um “jeans rasgado de 1000 dólares”: o ato de parecer deliberadamente modesto só está disponível para quem tem folga
Trabalhei em uma das Big Three, e o estilo do ChatGPT é exatamente o estilo de autoavaliação corporativa que aprendi na empresa
Embalar bem a “narrativa” era mais importante para promoção do que o resultado em si
Você é americano? Mesmo no mundo anglófono, há diferenças culturais entre o britânico e o americano
Os americanos são menos afetados e mais diretos, enquanto o inglês britânico ainda tende a ser mais floreado e ornamental
Pela minha percepção, o vocabulário dos britânicos vem diminuindo a cada geração
Existem dois objetivos na escrita
(1) Escrita para transmitir ideias — quanto mais simples, melhor. Como nos ensaios de Paul Graham, a informação entra na cabeça sem atrito
(2) Escrita para autoexpressão — um estilo floreado e artístico combina mais
Como disse David Foster Wallace, a primeira é uma escrita que se comunica como conversa, e a segunda é como um diário gritando: “Sou eu!”
É interessante que boa parte dos dados de treinamento de LLMs tenha sido curada no Quênia
Se os dados tivessem sido produzidos no Japão, talvez o ChatGPT usasse finais de frase à japonesa como “Don’t you agree?”
Artigo relacionado
A influência do autor de material didático indiano Malkiat Singh foi grande
Seus livros eram usados como material padrão no Quênia, e como seus alunos se tornaram curadores de dados para LLMs, esse estilo acabou se infiltrando na IA do mundo todo
Wiki de Malkiat Singh
(Resumindo) parece que não tinha muito como evitar
Parece que 樣 está preparando o meme “ChatGPT (Japan)” XD
Mas rotulagem de dados é algo separado dos dados de treinamento para geração de texto dos LLMs. Há muita confusão sobre isso
Li o guia de estilo do City News Bureau de Chicago de 1897, e havia muitas regras interessantes
Por exemplo, não confundir
nightcomevening, e não usarverydesnecessariamenteEsses detalhes mostram a sensibilidade linguística da época
veryAos meus olhos, o estilo deste texto parece totalmente diferente do ChatGPT
Muita gente vê o uso de em-dash (—) como sinal de IA, mas isso é um indício fraco
Na verdade, o ChatGPT produz mais um tom exagerado e uma “grandiosidade vazia”
Comparando os parágrafos de fato, a versão da IA é mais floreada, mas parece menos sincera
Este texto prende a atenção. A maioria das saídas do GPT perde meu foco depois de um parágrafo
Quando termino, fica a sensação de que nenhuma informação ficou
A diferença entre LLM e humano está na capacidade de falar muito sem dizer nada
Se você pede ao GPT para “melhorar” uma frase que já está bem acabada, é natural que ele só consiga deixá-la mais prolixa
O original tem ornamentos estruturais, mas preserva o significado. O texto escrito por IA tem baixa densidade informacional e é entediante
Sair caçando em-dash sem critério é coisa de gente que não entende gramática
Artistas e youtubers também estão enfrentando o mesmo problema
Está aumentando o fenômeno de ser confundido com IA só por parecer IA
De fato, parece plausível que dubladores estejam perdendo trabalho porque suas vozes lembram vozes sintéticas
Eu também publiquei vídeos de Factorio, e alguns espectadores comentaram que “a voz de IA incomoda”
Mas era eu mesmo falando, e meu rosto até aparecia no final do vídeo
Vozes de IA são sem emoção e com pronúncia estranha, então normalmente dá para notar rápido
Hoje em dia há muitos tutoriais “vazios” que apenas leem um roteiro escrito por IA
Por isso agora só assisto vídeos de criadores em quem confio
Link para meu vídeo
Se rostos de pessoas reais estão sendo usados sem permissão na geração de imagens por IA, Pierce Brosnan deveria ser o primeiro a receber compensação
No nosso time também havia um colega que falava como o ChatGPT
No WhatsApp e no Zoom, o jeito dele era tão mecânico que perguntei ao Meta AI, e a resposta foi: “parece texto escrito por IA”
Mas ele disse que não usava IA de fato, e hoje eu acho que isso pode muito bem ser verdade
Mas delegar à IA a detecção de IA não faz sentido. É como perguntar a ela sobre si mesma
Eu também já vivi essa experiência de “o ChatGPT escreve como eu”
Costumo usar listas e formatação, e prefiro textos amigáveis para dislexia
Mesmo em anotações que escrevi em 2019, já havia algo com cara de ChatGPT
Às vezes coloco erros ortográficos de propósito ou misturo um estilo não padronizado
Falando friamente: se um texto não se distingue da saída padrão do ChatGPT, então é um texto ruim
Mesmo que a pessoa não tenha usado IA, esse estilo precisa melhorar
Na educação, boas notas deveriam ir apenas para quem consegue escrever melhor do que a IA
É meio engraçado criticar um colega por “querer soar inteligente como o ChatGPT”
A discussão sobre em-dash é interessante
Antes eu só via quando o Word convertia automaticamente; nunca tinha digitado um manualmente
Foi agora que descobri que, no Windows, dá para fazer isso com Alt+0151
Então, para mim, o em-dash ainda é um símbolo pouco familiar
Agora passei a entender que as pessoas escrevem em ambientes diferentes
Na verdade, já havia gente no HN que adorava usar em-dash muito antes do ChatGPT
Ranking dos usuários de em-dash no HN
Eu ativo o Typo mode no emacs para inserir automaticamente en/em dash e aspas inteligentes
Analisei o dataset do HN, e o uso de em-dash não aumentou mesmo após a disseminação da IA
Mas uma estrutura excessivamente parentética é sim característica de IA ou de escrita imatura
No Bloco de Notas do macOS, já aconteceu de
--virar automaticamente—e quebrar um comando no terminalFiquei impressionado com o nível de inglês do OP
A maioria dos não nativos aprende inglês literário na escola, então se acostuma a um estilo mais formal
Eu também tive esse tipo de educação na França, mas trabalhando em TI migrei para um inglês americano mais direto
Este texto não foi escrito pelo ChatGPT. Não há ornamentos desnecessários e a densidade de informação é alta
Em textos de IA, eu costumo pular mais da metade, mas este era um texto em que eu não queria perder uma palavra sequer
É uma espécie de maldição de quem escreve bem
Como o ChatGPT foi projetado para imitar “boa escrita”, quanto melhor alguém escreve, maior a chance de ser confundido com IA
Já vi até textos cheios de erros gramaticais serem atacados por “soarem como ChatGPT”
Há informação pública de que o ChatGPT foi treinado com inglês comercial africano
Artigo relacionado
Se a definição de “escrever bem” for um estilo prolixo, genérico e que evita críticas, então isso faz sentido
Na verdade, LLMs não escrevem melhor do que humanos
Erram com frequência até gramática básica como
a/an, e ainda usam expressões de elipse semântica comobecause trafficQuando se vê isso, fica claro que a capacidade humana de ajustar significado com cuidado ainda está à frente
No texto do OP, não há aquela sensação artificial típica de LLM
O uso de em-dash também é natural, e há emoção pessoal ali
Eu odeio o estilo de escrita do ChatGPT
Ele cansa como texto de marketing e deixa só uma grandiosidade vazia
Esse tipo de texto desgasta o leitor e transmite pior a informação
É surpreendente que ensinem esse estilo no Quênia
A frase “Eu não escrevo como o ChatGPT; o ChatGPT escreve como eu” é marcante
No fim das contas, estamos caminhando para um futuro em que todos vamos falar e escrever como o ChatGPT
Crianças vão delegar a lição de casa, adultos vão terceirizar currículos e aconselhamento, e até nas conversas vamos acabar falando coisas como: “isso faz sentido, vou organizar os motivos em três pontos”
(emoji de check) Adicione mais emojis — humanos adoram emojis
(emoji de X vermelho) Evite palavras negativas como “bullshit”
(emoji de joinha) Em breve vamos superar o aprendizado por feedback humano (sorriso)
Que texto interessante.