65% das postagens do Hacker News têm sentimento negativo, e elas apresentam desempenho melhor

(philippdubach.com)

2 pontos por GN⁺ 2026-01-07 | 2 comentários | Compartilhar no WhatsApp

Em um estudo de análise de sentimento de postagens do Hacker News, cerca de 65% do total foi classificado com sentimento negativo, e essas postagens registraram pontuações mais altas em média
A pontuação média das postagens negativas foi de 35,6 pontos, contra 28 pontos de média geral, confirmando um prêmio de desempenho de cerca de 27%
A análise foi conduzida sobre 32 mil postagens e 340 mil comentários, e um viés negativo consistente apareceu em 6 tipos de modelos
Os modelos usados incluem DistilBERT, BERT Multi, RoBERTa, Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B, e o dashboard final usa resultados do DistilBERT por motivos de eficiência
Predomina uma negatividade centrada em críticas construtivas, como críticas técnicas, insatisfação com a indústria e frustração com APIs, o que sugere uma correlação entre engajamento e controvérsia

Resultado da análise de sentimento do Hacker News

A pontuação média das postagens do Hacker News é 28, e as postagens com sentimento negativo registram média de 35,6, indicando maior engajamento
- O desempenho das postagens negativas é 27% maior que a média geral
O estudo trata da dinâmica de atenção no HN (Hacker News), incluindo curvas de decaimento, anexação preferencial, probabilidade de sobrevivência e previsão de engajamento inicial
- O artigo em preprint relacionado está disponível no SSRN

Dados e composição dos modelos

O alvo da análise foi de 32 mil postagens e 340 mil comentários
Cerca de 65% do total foi classificado com sentimento negativo
- O pesquisador mencionou a possibilidade de o classificador ter um viés negativo, mas a mesma tendência foi confirmada em todos os 6 modelos
Os modelos utilizados foram DistilBERT, BERT Multi, RoBERTa (baseados em transformers) e Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B (baseados em LLM)
- A distribuição de sentimento varia entre os modelos, mas a inclinação negativa se mantém em comum
- O dashboard final usa resultados do DistilBERT, que operam com eficiência em um pipeline baseado em Cloudflare

Definição e características do sentimento negativo

O conteúdo classificado como “negativo” inclui críticas técnicas, ceticismo em relação a anúncios, insatisfação com práticas da indústria e frustração relacionada a APIs
A maior parte da negatividade consiste em críticas substanciais, e não ataques pessoais
- Críticas técnicas têm natureza diferente de ataques pessoais
O pesquisador reconhece ambas as possibilidades: se a negatividade gera engajamento, ou se conteúdos controversos atraem ao mesmo tempo expressões negativas e atenção

Planos de divulgação futura

O pesquisador deve divulgar em breve todo o código, o dataset e um dashboard para arquivistas do HN

2 comentários

shakespeares 2026-01-07

As pessoas se interessam mais por fofoca e ruído. [included generalização precipitada]

GN⁺ 2026-01-07

Opiniões no Hacker News

Acho que o classificador do OP está fazendo duas suposições que afetam o resultado
1. agrupa postura cética como negativa
2. não permite uma categoria neutra
  Estou escrevendo um comentário crítico agora, mas isso não é necessariamente “negativo”. Na verdade, só é possível criticar porque os dados e as conclusões do OP estão claros. Esse tipo de crítica construtiva é justamente sinal de uma boa discussão
- Sou o OP :)
  Está parcialmente certo que a postura cética é classificada como negativa. Os dados de treino do SST-2 tratam avaliação crítica como algo negativo. Mas aqui “negativo” não significa hostil, e sim avaliativo. A cultura crítica do HN é lida como negativa por esse tipo de modelo, mas isso é natural pelas características do discurso técnico.
  A neutralidade existe como uma pontuação contínua perto de 0,5. Como os usuários do HN tendem a tomar posições fortes, aparece uma distribuição mais polarizada. Vale a pena testar um modelo de 3 classes no futuro.
  Seu comentário é crítico, mas é um debate de alta qualidade. Vejo a negatividade do HN não como hostilidade, e sim como crítica construtiva que impulsiona a participação
- Eu também ia apontar que a postura cética está sendo agrupada como negativa. O olhar crítico do HN é, na verdade, uma característica positiva, mas esse tipo de distinção emocional sutil ainda é tecnicamente difícil
- Há muita crítica legítima, mas também existe o caça-pelo-em-ovo inútil no estilo “reply guy” e reclamações repetitivas sobre empresas específicas. Isso é difícil de classificar e, comparado ao Reddit, o HN parece bem melhor
- Não sei se é exatamente este o modelo que o OP usou, mas ele classifica seu comentário como 99,9% positivo
  Link do modelo DistilBERT SST-2
- Exato, o cerne do problema é que pensamento crítico está sendo classificado como negativo
Os posts negativos que publiquei tiveram desempenho melhor do que os neutros ou positivos.
O título “Richard Stallman is Dead” teve a maior taxa de cliques, e outro modelo prevê a probabilidade de a razão comentários/votos ser maior que 0,5. Clickbait, debates de gênero e temas sobre carros tiveram desempenho especialmente forte.
É difícil acreditar numa pontuação média de 35. Antigamente a média era algo como 8, então fiquei curioso sobre o critério de amostragem
- A amostra foi coletada com todos os posts e comentários dos últimos 35 dias usando a API hn-archiver.
  Pode ser que posts com nota 0 tenham ficado de fora, o que teria puxado a média para cima. Obrigado pelo feedback; vou revisar isso antes de publicar o artigo. Seu classificador também é interessante
- O exemplo “Richard Stallman is Dead” é engraçado demais. Lembra a antiga manchete de jornal “Generalissimo Francisco Franco Is Still Dead”. Claro, o RMS ainda está vivo
- Pergunta pessoal: você posta artigos científicos com uma frequência absurda. Já vi mais de 30 em um dia, então imagino que você não consiga ler tudo. Fiquei curioso sobre sua motivação e o processo de curadoria
Vejo um fenômeno parecido nos comentários. Comentários curtos e sarcásticos têm muito mais repercussão do que textos longos e analíticos.
Comentários longos e caprichados acabam ignorados, enquanto comentários curtos escritos no impulso às vezes “explodem”, o que é frustrante
- Meu karma é 104.872. As páginas HN Leaders e Best Comments são interessantes.
  O HN não gosta de piadas, exceto quando vêm acompanhadas de explicação
- Texto longo nem sempre é melhor. Existe a estética da concisão. Causar impacto com 20 caracteres em vez de 2.000 é mais difícil e tem mais valor
- Eu também uso duas contas, e a conta de comentários emocionais ou impulsivos tem eficiência de karma 4 vezes maior do que a principal. Mas a média é menor e a variância é maior
- Essa ideia de que “bom conteúdo não é recompensado” talvez signifique que não estamos produzindo um conteúdo tão bom quanto imaginamos.
  Acho que dá para sentir melhor esse critério de engajamento quando se mantém um blog
- Isso me fez querer mudar meu hábito de dar upvote. Fico pensando se, no HN, um upvote silencioso é uma forma de expressar concordância
Se “negativo” inclui crítica técnica, insatisfação com a indústria e frustração com APIs, então a maior parte das discussões no HN entra nessa categoria.
Comentar só “gostei” num texto promocional da OpenAI não agrega nada; análise crítica é justamente o tipo de participação valiosa.
Acho que posts populares sem comentários são, na verdade, prova de que o site está funcionando bem
- Gosto do fato de que ele apresentou os dados e deixou a interpretação para os leitores
- Concordo que é preciso separar “negatividade” em crítica vs. toxicidade. Misturar os dois conceitos é um erro
Nós mesmos filtramos para preferir reações negativas. Conteúdo positivo é mais autocontido e não estimula resposta, enquanto conteúdo negativo provoca interação
- Pela estrutura do site, comentários simplesmente positivos são substituídos pelo botão de upvote
- Comentários só dizendo “gostei” são vistos como inúteis, então o resultado é que há mais comentários neutros ou críticos
- Os humanos são evolutivamente sensíveis a estímulos negativos. Quem ignorava perigos não sobreviveu.
  Por isso somos mais atraídos por notícias negativas e apenas passamos por cima das positivas. Esse é o cerne da economia da atenção
- Eu aprendo mais com comentários que acrescentam informação do que com crítica destrutiva. Esse tipo de texto costuma ser mais novo e mais especializado
- (Em tom de piada) “Isso mesmo! … ah, espera aí”
Crítica técnica é diferente de ataque pessoal. A negatividade do HN é, em sua maior parte, crítica construtiva.
Quando o cinismo passa do ponto, inevitavelmente aparece “reclamação sobre a reclamação”.
Eu prefiro ouvir “você está com algo preso no dente” a receber elogios
- O artigo precisa tratar essa distinção com mais clareza. O modelo não consegue diferenciar “o design desta API está errado” de “esta empresa é horrível”.
  Como a moderação do HN remove rapidamente conteúdo hostil, o que sobra é, na maioria das vezes, crítica produtiva.
  O ponto interessante é que essa “negatividade” está associada a 27% mais engajamento. Ou seja, comunidades técnicas valorizam crítica mais do que propaganda
  Vou deixar explícito no artigo que “sentimento negativo” significa crítica avaliativa segundo o modelo SST-2, e não fala tóxica
- Cinismo não é uma filosofia de dizer a verdade. Dizer fatos não é crítica
Quando o acesso à API do Reddit ainda era possível, fiz um experimento no app leitor rif bloqueando subreddits de sentimento negativo.
Depois de bloquear centenas deles, sobraram apenas conteúdos positivos sobre animais e hobbies. Percebi o quanto o Reddit é centrado na negatividade e, ao mesmo tempo, que sem isso ele fica até meio entediante
Link da lista de bloqueio
- A atmosfera cínica do Reddit é como uma epidemia. Pessoas infelizes se juntam e reforçam o desespero umas das outras. Em sua maioria são jovens e menos experientes
- O fato de conteúdo controverso gerar mais discussão é da natureza humana. Você ouve longamente sobre problemas amorosos de um amigo, mas quando está tudo bem não há muito o que dizer
- Eu também evito política e conteúdo provocativo, e vejo só posts de hobbies ou criação. O Reddit realmente é um espaço muito misturado
- Acho que uma proporção de 45:65 entre positivo/negativo é o equilíbrio mais interessante. Se fosse 50:50, o conteúdo ficaria comum demais. Nesse ponto, o HN é melhor do que rede social
- Ainda uso rif. Troquei a chave da API com o Revanced para continuar usando. Como aumentaram os posts-isca para IA no Reddit, bloqueei os subreddits relacionados.
  Esses posts dão uma sensação de bots conversando com bots. Suspeito que o Reddit deixa essa estrutura existir para aumentar a exibição de anúncios
Na internet, não existe combinação mais poderosa do que reclamar ou corrigir alguém.
Como usuário de ESL (English as a Second Language), um dos primeiros termos de internet que aprendi foi “flamewar”
- Teve até gente perguntando o que era ESL
Segundo o artigo, a desigualdade de atenção no HN é muito severa. O coeficiente de Gini é 0,89, maior que o do Twitter
Isso provavelmente se deve à estrutura de exposição do HN. Posts novos começam em /newest e, se não recebem atenção inicial de um pequeno grupo, praticamente desaparecem.
Diferentemente do Reddit, onde existe uma exposição padrão, no HN é preciso passar pelo filtro inicial para chegar à página principal
- Graças a essa estrutura, a reação inicial funciona como indicador preditivo de sucesso
Engenheiros trabalham resolvendo problemas, então naturalmente desenvolvem pensamento crítico.
Em feiras do setor, os engenheiros abordavam tudo de braços cruzados e com frieza, enquanto a comunidade maker era cheia de energia positiva.
No fim, é a diferença entre “o copo está meio vazio” e “o copo está meio cheio”