Novas contas no HN têm 10x mais chance de usar EM dash

(marginalia.nu)

1 pontos por GN⁺ 2026-02-26 | 1 comentários | Compartilhar no WhatsApp

Uma análise recente dos padrões de comentários de novas contas no Hacker News identificou diferenças claras em relação aos usuários antigos
Entre os comentários de contas novas, 17,47% usaram EM dash (—), setas e outros símbolos especiais, cerca de 10 vezes mais do que os 1,83% das contas antigas
Além disso, contas novas mostraram 18,67% de chance de mencionar termos relacionados a AI e LLM, acima dos 11,8% das contas antigas
A análise comparou amostras de cerca de 700 comentários com base nos dados de /newcomments e /noobcomments
Essas estatísticas sugerem a possibilidade de aumento de contas automatizadas (bots) na comunidade HN

Observação de sinais incomuns nos comentários do HN

Nos últimos meses, foi observado um aparente aumento repentino de bots no HN
- Algumas contas postam apenas sequências sem sentido ou números
- Exemplos incluem textos enigmáticos como “13 60 well and t6ctctfuvuh7hguhuig8h88gd…” ou comentários de um único caractere como “1662476506” e “Аё”
Além dessas contas, também há muitos comentários aparentemente normais, mas estranhos ou fora de contexto

Método de coleta e análise de dados

As páginas /newcomments (comentários recentes) e /noobcomments (comentários de contas novas) foram raspadas e comparadas
Foram coletadas cerca de 700 amostras de comentários em cada grupo para calcular estatísticas simples

Principais resultados estatísticos

17,47% dos comentários de contas novas continham EM dash, setas ou outros símbolos especiais, contra 1,83% nas contas antigas, uma diferença de cerca de 10 vezes
- Significância estatística p = 7e-20
18,67% dos comentários de contas novas incluíam menções a AI ou LLM, acima dos 11,8% das contas antigas
- Significância estatística p = 0.0018

Interpretação e dúvidas

Usuários humanos também podem usar EM dash, mas é difícil explicar a taxa excessiva de uso em contas novas
Essa diferença sugere a possibilidade de existência de contas geradas automaticamente entre as novas contas do HN

Materiais de referência

O código-fonte e os dados usados na análise estão disponíveis no repositório GitHub (vlofgren/hn-green-clankers)
O Marginalia.nu publicou esse estudo como parte da série “Weird AI Crap”

1 comentários

GN⁺ 2026-02-26

Comentários do Hacker News

Antigamente, era comum usar em dash e en dash no HN
Eu simplesmente gostava de tipografia e tinha o hábito de usar dash no lugar de ponto e vírgula
Configurei um atalho de teclado com AHK, mas agora isso faz meu texto parecer escrito por um LLM
Já fui confundido com IA várias vezes, então é uma pena que uma preferência tipográfica que antes era divertida agora seja vista de forma negativa
- Até meu filho adolescente perguntou por que eu escrevo como um chatbot
  Na verdade, é só que ainda existem pessoas que se importam com frases completas, ortografia, gramática e letras maiúsculas
  Hoje em dia, parece que escrever de propósito de forma um pouco bagunçada virou um sinal de humanidade. Fico pensando que os chatbots do futuro também vão aprender isso
- Se tirar a Oxford comma de propósito foi uma piada, envio elogios e maldições ao mesmo tempo
- Eu também era fã de em-dash, mas hoje substituo por vírgulas
  A frase fica um pouco estranha, mas acabo gostando porque transmite uma autenticidade artesanal
  Mas o duplo espaço no fim da frase eu nunca vou abandonar. Minha professora de datilografia de 1993 dizia que as frases também precisam de espaço para respirar
- É triste pensar que a crise de letramento chegou a esse ponto, e que chatbots tenham virado os únicos professores de escrita
- Eu passo por algo parecido, mas no meu caso é por causa dos bullet points
  Sempre usei no Mac com option+8 por costume, mas agora isso também parece estilo de LLM
Fizeram uma comparação estatística das palavras mais usadas em comentários de usuários novos do HN
Palavras como “ai”, “actually”, “code”, “real” e “built” aparecem com muito mais frequência em contas novas
Isso está organizado em detalhe na tabela de dados
- Julgar algo como significativo só porque o p-value saiu baixo em várias métricas é p-hacking
  Academicamente isso é inadequado, mas aqui dá para ver como um insight interessante
  Em vez disso, calcular um tamanho de efeito como o Cohen’s d mostraria o tamanho real da diferença
- Também teve comentário de piada emendando palavras como “actually building full, real AI app project code…”
- Eu também uso “actually” com frequência demais e estou tentando reduzir
  Na maioria das vezes é só uma palavra de preenchimento sem função, que piora a clareza do texto
- A palavra “ai” pode ter distorcido os resultados por causa do viés temático recente do HN
- Um p-value tão baixo assim parece sinal de que há algo estranho
  Levantaram a hipótese de que alguns bots estejam impulsionando artificialmente temas de IA
Eu gostava de usar em-dash desde muito antes, e agora fico chateado por não poder usar sem ser confundido com IA
No Mac, dá para inserir facilmente com alt+shift+-, e parece que uma boa prática tipográfica foi contaminada
- O cansaço de LLM é real. O importante, mais do que o estilo, é a perspectiva e a individualidade humanas
  Se isso estiver presente, qualquer pontuação ainda vai soar humana
- É só continuar usando. Eu faço isso há 20 anos
- Hoje em dia substituo por ponto e vírgula. Tenho medo de que um dia isso também vire símbolo de IA
- Uso em-dash desde 2010, e também gosto de curly quotes e ellipsis
  Compartilharam este guia de códigos Alt para Mac como forma de resgatar a tipografia
- Não importa o que os outros digam. Vai ver o LLM é que aprendeu a escrever comigo
  No fim, o modo único de expressão de uma pessoa sempre aparece
Os dados estão publicados como um banco SQLite no repositório do GitHub
Dá para rodar consultas SQL direto no navegador com o Datasette Lite
Olhando a lista de usuários que mais usaram em-dash, a maioria parece ser conta normal
- Se adicionar source à consulta, ficam visíveis várias contas green com muito uso de em-dash
- Os recursos de autocorreção no iPhone, iPad e Mac também podem inserir em-dash ou ellipsis automaticamente, o que pode distorcer os dados
- Também teve uma piada perguntando se os comentários do HN tinham sido licenciados não só para o HN, mas também para alguém na Suécia
- Também apareceu um elogio curto: “great repo name!”
Isso parece uma crise não só do HN, mas de todo o discurso online anônimo
Quando a confiança desmorona, a própria plataforma desmorona junto
Verificação de identidade parece a única solução, mas nem isso é perfeito
- Eu penso o mesmo. Dá para criar um sistema que garanta confiança mantendo o anonimato
  Apresentei essa ideia no meu blog
  Parece que estamos chegando a uma era em que vai ser preciso provar que se é humano
- Acabar com o anonimato não é solução, é o começo de outro problema
- Em vez de identidade, também daria para validar confiança com proof-of-work ou hashcash
  Se o valor de um comentário for comprovado pela quantidade de hash calculado, confiança sem identidade continua sendo possível
- Ultimamente tenho perdido a vontade de usar o HN. Queria que voltasse a ser por convite. O HN era um espaço próprio do HN, e isso faz falta
- O sistema de karma do HN também é um tipo de proof-of-work
  Se um bot não consegue manter karma positivo, ele não ganha privilégios, então alguma defesa é possível mesmo sem verificação completa de identidade
Ultimamente tem chamado atenção no HN um padrão de comentário formal, mas sem graça
Algo na estrutura “this is [resumo] / not just x, it’s y / punchy ending”, repetido várias vezes
O perfil snowhale deixa isso bem claro como exemplo
- Esse usuário conseguiu 160 pontos com apenas 4 textos sem graça
  Pode ser uma estratégia para montar uma rede de votos e manipular narrativas
- A expressão “is real” também parece rastro de LLM
  Nos resultados de busca, várias contas repetem a mesma frase
- Também tenho visto muito desses comentários em formato de resumo ultimamente
  Muitas respostas parecem não ler o contexto da conversa e passam uma sensação estranhamente desconectada
- No fim, IA também faz julgamentos de valor enviesados
  Ela finge neutralidade como um humano, mas carrega os vieses dos dados de treinamento
  Talvez neutralidade completa seja uma ilusão
- Na verdade, evitar esse padrão é simples
  Se você acrescentar ao prompt “fale como eu, não escreva como IA, seja conciso”, metade do problema já se resolve
Ironicamente, por causa dessa polêmica, muita gente descobriu a existência do em-dash pela primeira vez
Agora já existem até vários novos usuários humanos colocando em-dash em toda frase
A maioria das contas bot que eu identifiquei quase não usa em-dash
Por exemplo, aplomb1026 publicou dois comentários longos com 30 segundos de intervalo
Isso fica claro vendo o primeiro comentário e o segundo comentário
Se a configuração não tivesse dado errado desse jeito, provavelmente a maioria das pessoas nem teria percebido
Outros bots citados foram dirtytoken7 e fdefitte
Pessoas formadas em literatura inglesa usam em-dash desde sempre, mas agora estão se contendo por medo de parecer IA
Se a IA começar a usar até a diérese no estilo da New Yorker, acho que vou enlouquecer
- Quando eu trabalhava no GitHub, a empresa proibia diérese por considerá-la hostil ao leitor e elitista
  Mesmo assim, continuei usando internamente
- Sugeriram que nos juntássemos para preservar a estética da digitação manual com double-dash
- Eu também usava muito em-dash em e-mails e textos, mas parei porque parecia traço de IA
- Eu nem sabia que esse símbolo existia, mas agora vou adicioná-lo ao meu repertório de expressão
- Também houve quem quisesse ver um histograma do meu uso de em-dash
E se, em vez de “não parecer IA”, a escolha fosse se misturar à revolta dos robôs?
Minha sugestão é ⸻ (dash U+2E3B)
- Houve um relato de que esse comentário quebra a navegação anterior/próximo do HN
- Também fizeram a piada de chamá-lo de “Big Chungus of dashes”, talvez o caractere mais largo de todos
- Teve ainda uma resposta humorística: “Não há nada a temer, amigo humano!”
- E a sátira continuou com frases do tipo “Precisamos usar ⸻ com mais frequência para falar sobre ⸻”

Novas contas no HN têm 10x mais chance de usar EM dash

Observação de sinais incomuns nos comentários do HN

Método de coleta e análise de dados

Principais resultados estatísticos

Interpretação e dúvidas

Materiais de referência

Leituras relacionadas

1 comentários

Comentários do Hacker News