4 pontos por GN⁺ 2025-12-16 | 2 comentários | Compartilhar no WhatsApp
  • O estilo formal de inglês moldado pelo sistema educacional do Quênia vem sendo repetidamente apontado como algo que parece texto gerado por IA
  • O treinamento estrutural do ensino de redação em inglês enfatiza equilíbrio das frases, fluxo lógico e uso de conectivos, produzindo resultados semelhantes à escrita de IA
  • Esse estilo é um legado do ensino de inglês britânico da era colonial e foi mantido como símbolo de status social e instrução
  • Aponta-se o problema de viés em detectores de IA e modelos de linguagem, que julgam textos de não nativos como ‘não humanos’
  • Enfatiza-se que o que se revela na escrita não é uma máquina, mas o produto de história, educação e identidade linguística

O mal-entendido entre IA e escrita humana

  • O texto parte da experiência do autor ao receber o feedback de que sua proposta “parecia ter sido escrita pelo ChatGPT”
    • Seu estilo foi avaliado como ‘pouco humano’ por ser estruturado e lógico
  • Muitos escritores passam por reações semelhantes, e isso se conecta a preconceitos contra autores não nativos
  • O autor explica que sua escrita se parece com a IA porque a IA aprendeu com os modos de ensino deles

A formação do ensino de inglês no estilo queniano

  • A prova de redação em inglês do KCPE (Certificado de Educação Primária do Quênia) é o núcleo do treinamento de escrita
    • Para obter nota alta em uma prova de 40 pontos, é preciso dominar vocabulário rico e estruturas frasais complexas
  • As regras de redação se resumem em três pontos
    • Começar com um provérbio ou uma frase forte, usar vocabulário variado e manter uma estrutura perfeita
  • O professor desempenha o papel do ‘algoritmo original’ que corrige gramática e estrutura com caneta vermelha
  • Esse treinamento enfatiza a construção de frases lógicas e equilibradas e continua no ensino médio e na universidade

Legado colonial e hierarquia da linguagem

  • O ensino de inglês no Quênia se origina do sistema linguístico do Império Britânico
    • Valoriza-se a correção gramatical e a formalidade com base no ‘Queen’s English’
  • Mesmo após a independência, essa língua foi mantida como idioma oficial e símbolo de status social
    • Falar um inglês refinado tornou-se um critério para distinguir nível educacional e classe social
  • Como resultado, o vasto repertório de escrita formal aprendido pela IA acabou assumindo uma forma semelhante ao produto do ensino de inglês queniano

Viés e limites dos detectores de IA

  • Detectores de IA classificam textos com base em ‘perplexity’ (previsibilidade) e ‘burstiness’ (variação no comprimento das frases)
    • Estruturas frasais previsíveis e ritmo constante são considerados não humanos
  • No entanto, o ensino queniano justamente toma como ideal esse estilo previsível e equilibrado
  • Pesquisas mostram que esses detectores têm alta probabilidade de classificar erroneamente textos de não nativos como gerados por IA
  • Isso revela um viés técnico que exclui a diversidade linguística

Redefinindo humanidade e linguagem

  • A escrita de autores quenianos é resultado de educação, história e cultura, não de máquinas
  • O texto critica a realidade em que o padrão de ‘escrita humana’ fica restrito a expressões informais e de estilo americano
  • Escritores de Nairóbi, Lagos e Mumbai também compartilham tradições de escrita que valorizam precisão e lógica
  • Julgar que algo “parece IA” é um olhar incapaz de reconhecer outras formas de humanidade
  • A conclusão do texto encerra com a declaração de que esta é a escrita de um queniano, um modo que existe há muito tempo

2 comentários

 
GN⁺ 2025-12-16
Comentários do Hacker News
  • Nossa geração aprendeu regras não escritas da escrita transmitidas de professor para aluno
    A primeira frase tinha que começar com um provérbio ou uma frase impactante, e era preciso usar expressões como strode purposefully em vez de palavras comuns
    Mas, ao estudar escrita na universidade, isso foi gradualmente sendo substituído por frases simples e expressões curtas
    Hoje, o estilo de Hemingway parece o ideal. O estilo floreado do ChatGPT, ao contrário, dá uma sensação de cansaço
    Reconheço a habilidade do autor, mas prefiro textos simples e claros

    • A obsessão por escrever frases curtas estragou a prosa em inglês
      Para a maioria das pessoas, simplicidade ajuda, mas o problema é tratar frases longas, ponto e vírgula e vocabulário mais sutil como “má escrita”
      Essa atitude bloqueia o crescimento tanto do leitor quanto do escritor
      Dito isso, expressões como proceeded to continuam sendo lixo. Obrigar alunos a usar palavras para “parecer inteligentes” é uma das piores formas de ensino
      Minha esposa é escritora, e diz que a palavra strode aparece com frequência anormal em fanfics e romances. Escrever que todo mundo “caminhou com firmeza” cada vez que anda é um traço comum de amadores

    • sinais de classe escondidos no estilo de escrita
      Como o artigo diz, o inglês que aprendemos era o Queen’s English da era imperialista, a linguagem do poder
      Aprender a forma elegante da escrita não era apenas para passar em provas, mas para provar que se era uma “pessoa civilizada”
      As modas da escrita se parecem com o ciclo da moda na sociedade. Quando um estilo floreado se populariza, a elite passa a se diferenciar com um estilo simples
      O estilo contido de Hemingway é como um “jeans rasgado de 1000 dólares”: o ato de parecer deliberadamente modesto só está disponível para quem tem folga

    • Trabalhei em uma das Big Three, e o estilo do ChatGPT é exatamente o estilo de autoavaliação corporativa que aprendi na empresa
      Embalar bem a “narrativa” era mais importante para promoção do que o resultado em si

    • Você é americano? Mesmo no mundo anglófono, há diferenças culturais entre o britânico e o americano
      Os americanos são menos afetados e mais diretos, enquanto o inglês britânico ainda tende a ser mais floreado e ornamental
      Pela minha percepção, o vocabulário dos britânicos vem diminuindo a cada geração

    • Existem dois objetivos na escrita
      (1) Escrita para transmitir ideias — quanto mais simples, melhor. Como nos ensaios de Paul Graham, a informação entra na cabeça sem atrito
      (2) Escrita para autoexpressão — um estilo floreado e artístico combina mais
      Como disse David Foster Wallace, a primeira é uma escrita que se comunica como conversa, e a segunda é como um diário gritando: “Sou eu!”

  • É interessante que boa parte dos dados de treinamento de LLMs tenha sido curada no Quênia
    Se os dados tivessem sido produzidos no Japão, talvez o ChatGPT usasse finais de frase à japonesa como “Don’t you agree?”
    Artigo relacionado

    • A influência do autor de material didático indiano Malkiat Singh foi grande
      Seus livros eram usados como material padrão no Quênia, e como seus alunos se tornaram curadores de dados para LLMs, esse estilo acabou se infiltrando na IA do mundo todo
      Wiki de Malkiat Singh

    • (Resumindo) parece que não tinha muito como evitar

    • Parece que 樣 está preparando o meme “ChatGPT (Japan)” XD

    • Mas rotulagem de dados é algo separado dos dados de treinamento para geração de texto dos LLMs. Há muita confusão sobre isso

  • Li o guia de estilo do City News Bureau de Chicago de 1897, e havia muitas regras interessantes
    Por exemplo, não confundir night com evening, e não usar very desnecessariamente
    Esses detalhes mostram a sensibilidade linguística da época

    • Como referência, o LWN ainda mantém essa postura de evitar very
  • Aos meus olhos, o estilo deste texto parece totalmente diferente do ChatGPT
    Muita gente vê o uso de em-dash (—) como sinal de IA, mas isso é um indício fraco
    Na verdade, o ChatGPT produz mais um tom exagerado e uma “grandiosidade vazia”
    Comparando os parágrafos de fato, a versão da IA é mais floreada, mas parece menos sincera

    • Este texto prende a atenção. A maioria das saídas do GPT perde meu foco depois de um parágrafo
      Quando termino, fica a sensação de que nenhuma informação ficou

    • A diferença entre LLM e humano está na capacidade de falar muito sem dizer nada

    • Se você pede ao GPT para “melhorar” uma frase que já está bem acabada, é natural que ele só consiga deixá-la mais prolixa
      O original tem ornamentos estruturais, mas preserva o significado. O texto escrito por IA tem baixa densidade informacional e é entediante

    • Sair caçando em-dash sem critério é coisa de gente que não entende gramática

  • Artistas e youtubers também estão enfrentando o mesmo problema
    Está aumentando o fenômeno de ser confundido com IA só por parecer IA
    De fato, parece plausível que dubladores estejam perdendo trabalho porque suas vozes lembram vozes sintéticas

    • Eu também publiquei vídeos de Factorio, e alguns espectadores comentaram que “a voz de IA incomoda”
      Mas era eu mesmo falando, e meu rosto até aparecia no final do vídeo
      Vozes de IA são sem emoção e com pronúncia estranha, então normalmente dá para notar rápido
      Hoje em dia há muitos tutoriais “vazios” que apenas leem um roteiro escrito por IA
      Por isso agora só assisto vídeos de criadores em quem confio
      Link para meu vídeo

    • Se rostos de pessoas reais estão sendo usados sem permissão na geração de imagens por IA, Pierce Brosnan deveria ser o primeiro a receber compensação

  • No nosso time também havia um colega que falava como o ChatGPT
    No WhatsApp e no Zoom, o jeito dele era tão mecânico que perguntei ao Meta AI, e a resposta foi: “parece texto escrito por IA”
    Mas ele disse que não usava IA de fato, e hoje eu acho que isso pode muito bem ser verdade

    • Mas delegar à IA a detecção de IA não faz sentido. É como perguntar a ela sobre si mesma

    • Eu também já vivi essa experiência de “o ChatGPT escreve como eu”
      Costumo usar listas e formatação, e prefiro textos amigáveis para dislexia
      Mesmo em anotações que escrevi em 2019, já havia algo com cara de ChatGPT
      Às vezes coloco erros ortográficos de propósito ou misturo um estilo não padronizado

    • Falando friamente: se um texto não se distingue da saída padrão do ChatGPT, então é um texto ruim
      Mesmo que a pessoa não tenha usado IA, esse estilo precisa melhorar
      Na educação, boas notas deveriam ir apenas para quem consegue escrever melhor do que a IA

    • É meio engraçado criticar um colega por “querer soar inteligente como o ChatGPT”

  • A discussão sobre em-dash é interessante
    Antes eu só via quando o Word convertia automaticamente; nunca tinha digitado um manualmente
    Foi agora que descobri que, no Windows, dá para fazer isso com Alt+0151
    Então, para mim, o em-dash ainda é um símbolo pouco familiar
    Agora passei a entender que as pessoas escrevem em ambientes diferentes

    • Na verdade, já havia gente no HN que adorava usar em-dash muito antes do ChatGPT
      Ranking dos usuários de em-dash no HN

    • Eu ativo o Typo mode no emacs para inserir automaticamente en/em dash e aspas inteligentes

    • Analisei o dataset do HN, e o uso de em-dash não aumentou mesmo após a disseminação da IA
      Mas uma estrutura excessivamente parentética é sim característica de IA ou de escrita imatura

    • No Bloco de Notas do macOS, já aconteceu de -- virar automaticamente e quebrar um comando no terminal

  • Fiquei impressionado com o nível de inglês do OP
    A maioria dos não nativos aprende inglês literário na escola, então se acostuma a um estilo mais formal
    Eu também tive esse tipo de educação na França, mas trabalhando em TI migrei para um inglês americano mais direto
    Este texto não foi escrito pelo ChatGPT. Não há ornamentos desnecessários e a densidade de informação é alta
    Em textos de IA, eu costumo pular mais da metade, mas este era um texto em que eu não queria perder uma palavra sequer

  • É uma espécie de maldição de quem escreve bem
    Como o ChatGPT foi projetado para imitar “boa escrita”, quanto melhor alguém escreve, maior a chance de ser confundido com IA
    Já vi até textos cheios de erros gramaticais serem atacados por “soarem como ChatGPT”

    • Há informação pública de que o ChatGPT foi treinado com inglês comercial africano
      Artigo relacionado
      Se a definição de “escrever bem” for um estilo prolixo, genérico e que evita críticas, então isso faz sentido

    • Na verdade, LLMs não escrevem melhor do que humanos
      Erram com frequência até gramática básica como a/an, e ainda usam expressões de elipse semântica como because traffic
      Quando se vê isso, fica claro que a capacidade humana de ajustar significado com cuidado ainda está à frente

    • No texto do OP, não há aquela sensação artificial típica de LLM
      O uso de em-dash também é natural, e há emoção pessoal ali

    • Eu odeio o estilo de escrita do ChatGPT
      Ele cansa como texto de marketing e deixa só uma grandiosidade vazia
      Esse tipo de texto desgasta o leitor e transmite pior a informação
      É surpreendente que ensinem esse estilo no Quênia

  • A frase “Eu não escrevo como o ChatGPT; o ChatGPT escreve como eu” é marcante
    No fim das contas, estamos caminhando para um futuro em que todos vamos falar e escrever como o ChatGPT
    Crianças vão delegar a lição de casa, adultos vão terceirizar currículos e aconselhamento, e até nas conversas vamos acabar falando coisas como: “isso faz sentido, vou organizar os motivos em três pontos”

    • (emoji de estrela nos olhos) “Isso mesmo, Jim!”
      (emoji de check) Adicione mais emojis — humanos adoram emojis
      (emoji de X vermelho) Evite palavras negativas como “bullshit”
      (emoji de joinha) Em breve vamos superar o aprendizado por feedback humano (sorriso)
 
yinn27 2025-12-16

Que texto interessante.