1 pontos por GN⁺ 2026-02-26 | 1 comentários | Compartilhar no WhatsApp
  • Uma análise recente dos padrões de comentários de novas contas no Hacker News identificou diferenças claras em relação aos usuários antigos
  • Entre os comentários de contas novas, 17,47% usaram EM dash (—), setas e outros símbolos especiais, cerca de 10 vezes mais do que os 1,83% das contas antigas
  • Além disso, contas novas mostraram 18,67% de chance de mencionar termos relacionados a AI e LLM, acima dos 11,8% das contas antigas
  • A análise comparou amostras de cerca de 700 comentários com base nos dados de /newcomments e /noobcomments
  • Essas estatísticas sugerem a possibilidade de aumento de contas automatizadas (bots) na comunidade HN

Observação de sinais incomuns nos comentários do HN

  • Nos últimos meses, foi observado um aparente aumento repentino de bots no HN
    • Algumas contas postam apenas sequências sem sentido ou números
    • Exemplos incluem textos enigmáticos como “13 60 well and t6ctctfuvuh7hguhuig8h88gd…” ou comentários de um único caractere como “1662476506” e “Аё”
  • Além dessas contas, também há muitos comentários aparentemente normais, mas estranhos ou fora de contexto

Método de coleta e análise de dados

  • As páginas /newcomments (comentários recentes) e /noobcomments (comentários de contas novas) foram raspadas e comparadas
  • Foram coletadas cerca de 700 amostras de comentários em cada grupo para calcular estatísticas simples

Principais resultados estatísticos

  • 17,47% dos comentários de contas novas continham EM dash, setas ou outros símbolos especiais, contra 1,83% nas contas antigas, uma diferença de cerca de 10 vezes
    • Significância estatística p = 7e-20
  • 18,67% dos comentários de contas novas incluíam menções a AI ou LLM, acima dos 11,8% das contas antigas
    • Significância estatística p = 0.0018

Interpretação e dúvidas

  • Usuários humanos também podem usar EM dash, mas é difícil explicar a taxa excessiva de uso em contas novas
  • Essa diferença sugere a possibilidade de existência de contas geradas automaticamente entre as novas contas do HN

Materiais de referência

  • O código-fonte e os dados usados na análise estão disponíveis no repositório GitHub (vlofgren/hn-green-clankers)
  • O Marginalia.nu publicou esse estudo como parte da série “Weird AI Crap”

1 comentários

 
GN⁺ 2026-02-26
Comentários do Hacker News
  • Antigamente, era comum usar em dash e en dash no HN
    Eu simplesmente gostava de tipografia e tinha o hábito de usar dash no lugar de ponto e vírgula
    Configurei um atalho de teclado com AHK, mas agora isso faz meu texto parecer escrito por um LLM
    Já fui confundido com IA várias vezes, então é uma pena que uma preferência tipográfica que antes era divertida agora seja vista de forma negativa

    • Até meu filho adolescente perguntou por que eu escrevo como um chatbot
      Na verdade, é só que ainda existem pessoas que se importam com frases completas, ortografia, gramática e letras maiúsculas
      Hoje em dia, parece que escrever de propósito de forma um pouco bagunçada virou um sinal de humanidade. Fico pensando que os chatbots do futuro também vão aprender isso
    • Se tirar a Oxford comma de propósito foi uma piada, envio elogios e maldições ao mesmo tempo
    • Eu também era fã de em-dash, mas hoje substituo por vírgulas
      A frase fica um pouco estranha, mas acabo gostando porque transmite uma autenticidade artesanal
      Mas o duplo espaço no fim da frase eu nunca vou abandonar. Minha professora de datilografia de 1993 dizia que as frases também precisam de espaço para respirar
    • É triste pensar que a crise de letramento chegou a esse ponto, e que chatbots tenham virado os únicos professores de escrita
    • Eu passo por algo parecido, mas no meu caso é por causa dos bullet points
      Sempre usei no Mac com option+8 por costume, mas agora isso também parece estilo de LLM
  • Fizeram uma comparação estatística das palavras mais usadas em comentários de usuários novos do HN
    Palavras como “ai”, “actually”, “code”, “real” e “built” aparecem com muito mais frequência em contas novas
    Isso está organizado em detalhe na tabela de dados

    • Julgar algo como significativo só porque o p-value saiu baixo em várias métricas é p-hacking
      Academicamente isso é inadequado, mas aqui dá para ver como um insight interessante
      Em vez disso, calcular um tamanho de efeito como o Cohen’s d mostraria o tamanho real da diferença
    • Também teve comentário de piada emendando palavras como “actually building full, real AI app project code…”
    • Eu também uso “actually” com frequência demais e estou tentando reduzir
      Na maioria das vezes é só uma palavra de preenchimento sem função, que piora a clareza do texto
    • A palavra “ai” pode ter distorcido os resultados por causa do viés temático recente do HN
    • Um p-value tão baixo assim parece sinal de que há algo estranho
      Levantaram a hipótese de que alguns bots estejam impulsionando artificialmente temas de IA
  • Eu gostava de usar em-dash desde muito antes, e agora fico chateado por não poder usar sem ser confundido com IA
    No Mac, dá para inserir facilmente com alt+shift+-, e parece que uma boa prática tipográfica foi contaminada

    • O cansaço de LLM é real. O importante, mais do que o estilo, é a perspectiva e a individualidade humanas
      Se isso estiver presente, qualquer pontuação ainda vai soar humana
    • É só continuar usando. Eu faço isso há 20 anos
    • Hoje em dia substituo por ponto e vírgula. Tenho medo de que um dia isso também vire símbolo de IA
    • Uso em-dash desde 2010, e também gosto de curly quotes e ellipsis
      Compartilharam este guia de códigos Alt para Mac como forma de resgatar a tipografia
    • Não importa o que os outros digam. Vai ver o LLM é que aprendeu a escrever comigo
      No fim, o modo único de expressão de uma pessoa sempre aparece
  • Os dados estão publicados como um banco SQLite no repositório do GitHub
    Dá para rodar consultas SQL direto no navegador com o Datasette Lite
    Olhando a lista de usuários que mais usaram em-dash, a maioria parece ser conta normal

    • Se adicionar source à consulta, ficam visíveis várias contas green com muito uso de em-dash
    • Os recursos de autocorreção no iPhone, iPad e Mac também podem inserir em-dash ou ellipsis automaticamente, o que pode distorcer os dados
    • Também teve uma piada perguntando se os comentários do HN tinham sido licenciados não só para o HN, mas também para alguém na Suécia
    • Também apareceu um elogio curto: “great repo name!”
  • Isso parece uma crise não só do HN, mas de todo o discurso online anônimo
    Quando a confiança desmorona, a própria plataforma desmorona junto
    Verificação de identidade parece a única solução, mas nem isso é perfeito

    • Eu penso o mesmo. Dá para criar um sistema que garanta confiança mantendo o anonimato
      Apresentei essa ideia no meu blog
      Parece que estamos chegando a uma era em que vai ser preciso provar que se é humano
    • Acabar com o anonimato não é solução, é o começo de outro problema
    • Em vez de identidade, também daria para validar confiança com proof-of-work ou hashcash
      Se o valor de um comentário for comprovado pela quantidade de hash calculado, confiança sem identidade continua sendo possível
    • Ultimamente tenho perdido a vontade de usar o HN. Queria que voltasse a ser por convite. O HN era um espaço próprio do HN, e isso faz falta
    • O sistema de karma do HN também é um tipo de proof-of-work
      Se um bot não consegue manter karma positivo, ele não ganha privilégios, então alguma defesa é possível mesmo sem verificação completa de identidade
  • Ultimamente tem chamado atenção no HN um padrão de comentário formal, mas sem graça
    Algo na estrutura “this is [resumo] / not just x, it’s y / punchy ending”, repetido várias vezes
    O perfil snowhale deixa isso bem claro como exemplo

    • Esse usuário conseguiu 160 pontos com apenas 4 textos sem graça
      Pode ser uma estratégia para montar uma rede de votos e manipular narrativas
    • A expressão “is real” também parece rastro de LLM
      Nos resultados de busca, várias contas repetem a mesma frase
    • Também tenho visto muito desses comentários em formato de resumo ultimamente
      Muitas respostas parecem não ler o contexto da conversa e passam uma sensação estranhamente desconectada
    • No fim, IA também faz julgamentos de valor enviesados
      Ela finge neutralidade como um humano, mas carrega os vieses dos dados de treinamento
      Talvez neutralidade completa seja uma ilusão
    • Na verdade, evitar esse padrão é simples
      Se você acrescentar ao prompt “fale como eu, não escreva como IA, seja conciso”, metade do problema já se resolve
  • Ironicamente, por causa dessa polêmica, muita gente descobriu a existência do em-dash pela primeira vez
    Agora já existem até vários novos usuários humanos colocando em-dash em toda frase

  • A maioria das contas bot que eu identifiquei quase não usa em-dash
    Por exemplo, aplomb1026 publicou dois comentários longos com 30 segundos de intervalo
    Isso fica claro vendo o primeiro comentário e o segundo comentário
    Se a configuração não tivesse dado errado desse jeito, provavelmente a maioria das pessoas nem teria percebido
    Outros bots citados foram dirtytoken7 e fdefitte

  • Pessoas formadas em literatura inglesa usam em-dash desde sempre, mas agora estão se contendo por medo de parecer IA
    Se a IA começar a usar até a diérese no estilo da New Yorker, acho que vou enlouquecer

    • Quando eu trabalhava no GitHub, a empresa proibia diérese por considerá-la hostil ao leitor e elitista
      Mesmo assim, continuei usando internamente
    • Sugeriram que nos juntássemos para preservar a estética da digitação manual com double-dash
    • Eu também usava muito em-dash em e-mails e textos, mas parei porque parecia traço de IA
    • Eu nem sabia que esse símbolo existia, mas agora vou adicioná-lo ao meu repertório de expressão
    • Também houve quem quisesse ver um histograma do meu uso de em-dash
  • E se, em vez de “não parecer IA”, a escolha fosse se misturar à revolta dos robôs?
    Minha sugestão é ⸻ (dash U+2E3B)

    • Houve um relato de que esse comentário quebra a navegação anterior/próximo do HN
    • Também fizeram a piada de chamá-lo de “Big Chungus of dashes”, talvez o caractere mais largo de todos
    • Teve ainda uma resposta humorística: “Não há nada a temer, amigo humano!
    • E a sátira continuou com frases do tipo “Precisamos usar ⸻ com mais frequência para falar sobre ⸻”