2 pontos por GN⁺ 2026-01-07 | 2 comentários | Compartilhar no WhatsApp
  • Em um estudo de análise de sentimento de postagens do Hacker News, cerca de 65% do total foi classificado com sentimento negativo, e essas postagens registraram pontuações mais altas em média
  • A pontuação média das postagens negativas foi de 35,6 pontos, contra 28 pontos de média geral, confirmando um prêmio de desempenho de cerca de 27%
  • A análise foi conduzida sobre 32 mil postagens e 340 mil comentários, e um viés negativo consistente apareceu em 6 tipos de modelos
  • Os modelos usados incluem DistilBERT, BERT Multi, RoBERTa, Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B, e o dashboard final usa resultados do DistilBERT por motivos de eficiência
  • Predomina uma negatividade centrada em críticas construtivas, como críticas técnicas, insatisfação com a indústria e frustração com APIs, o que sugere uma correlação entre engajamento e controvérsia

Resultado da análise de sentimento do Hacker News

  • A pontuação média das postagens do Hacker News é 28, e as postagens com sentimento negativo registram média de 35,6, indicando maior engajamento
    • O desempenho das postagens negativas é 27% maior que a média geral
  • O estudo trata da dinâmica de atenção no HN (Hacker News), incluindo curvas de decaimento, anexação preferencial, probabilidade de sobrevivência e previsão de engajamento inicial
    • O artigo em preprint relacionado está disponível no SSRN

Dados e composição dos modelos

  • O alvo da análise foi de 32 mil postagens e 340 mil comentários
  • Cerca de 65% do total foi classificado com sentimento negativo
    • O pesquisador mencionou a possibilidade de o classificador ter um viés negativo, mas a mesma tendência foi confirmada em todos os 6 modelos
  • Os modelos utilizados foram DistilBERT, BERT Multi, RoBERTa (baseados em transformers) e Llama 3.1 8B, Mistral 3.1 24B, Gemma 3 12B (baseados em LLM)
    • A distribuição de sentimento varia entre os modelos, mas a inclinação negativa se mantém em comum
    • O dashboard final usa resultados do DistilBERT, que operam com eficiência em um pipeline baseado em Cloudflare

Definição e características do sentimento negativo

  • O conteúdo classificado como “negativo” inclui críticas técnicas, ceticismo em relação a anúncios, insatisfação com práticas da indústria e frustração relacionada a APIs
  • A maior parte da negatividade consiste em críticas substanciais, e não ataques pessoais
    • Críticas técnicas têm natureza diferente de ataques pessoais
  • O pesquisador reconhece ambas as possibilidades: se a negatividade gera engajamento, ou se conteúdos controversos atraem ao mesmo tempo expressões negativas e atenção

Planos de divulgação futura

  • O pesquisador deve divulgar em breve todo o código, o dataset e um dashboard para arquivistas do HN

2 comentários

 
shakespeares 2026-01-07

As pessoas se interessam mais por fofoca e ruído. [included generalização precipitada]

 
GN⁺ 2026-01-07
Opiniões no Hacker News
  • Acho que o classificador do OP está fazendo duas suposições que afetam o resultado

    1. agrupa postura cética como negativa
    2. não permite uma categoria neutra
      Estou escrevendo um comentário crítico agora, mas isso não é necessariamente “negativo”. Na verdade, só é possível criticar porque os dados e as conclusões do OP estão claros. Esse tipo de crítica construtiva é justamente sinal de uma boa discussão
    • Sou o OP :)
      Está parcialmente certo que a postura cética é classificada como negativa. Os dados de treino do SST-2 tratam avaliação crítica como algo negativo. Mas aqui “negativo” não significa hostil, e sim avaliativo. A cultura crítica do HN é lida como negativa por esse tipo de modelo, mas isso é natural pelas características do discurso técnico.
      A neutralidade existe como uma pontuação contínua perto de 0,5. Como os usuários do HN tendem a tomar posições fortes, aparece uma distribuição mais polarizada. Vale a pena testar um modelo de 3 classes no futuro.
      Seu comentário é crítico, mas é um debate de alta qualidade. Vejo a negatividade do HN não como hostilidade, e sim como crítica construtiva que impulsiona a participação
    • Eu também ia apontar que a postura cética está sendo agrupada como negativa. O olhar crítico do HN é, na verdade, uma característica positiva, mas esse tipo de distinção emocional sutil ainda é tecnicamente difícil
    • Há muita crítica legítima, mas também existe o caça-pelo-em-ovo inútil no estilo “reply guy” e reclamações repetitivas sobre empresas específicas. Isso é difícil de classificar e, comparado ao Reddit, o HN parece bem melhor
    • Não sei se é exatamente este o modelo que o OP usou, mas ele classifica seu comentário como 99,9% positivo
      Link do modelo DistilBERT SST-2
    • Exato, o cerne do problema é que pensamento crítico está sendo classificado como negativo
  • Os posts negativos que publiquei tiveram desempenho melhor do que os neutros ou positivos.
    O título “Richard Stallman is Dead” teve a maior taxa de cliques, e outro modelo prevê a probabilidade de a razão comentários/votos ser maior que 0,5. Clickbait, debates de gênero e temas sobre carros tiveram desempenho especialmente forte.
    É difícil acreditar numa pontuação média de 35. Antigamente a média era algo como 8, então fiquei curioso sobre o critério de amostragem

    • A amostra foi coletada com todos os posts e comentários dos últimos 35 dias usando a API hn-archiver.
      Pode ser que posts com nota 0 tenham ficado de fora, o que teria puxado a média para cima. Obrigado pelo feedback; vou revisar isso antes de publicar o artigo. Seu classificador também é interessante
    • O exemplo “Richard Stallman is Dead” é engraçado demais. Lembra a antiga manchete de jornal “Generalissimo Francisco Franco Is Still Dead”. Claro, o RMS ainda está vivo
    • Pergunta pessoal: você posta artigos científicos com uma frequência absurda. Já vi mais de 30 em um dia, então imagino que você não consiga ler tudo. Fiquei curioso sobre sua motivação e o processo de curadoria
  • Vejo um fenômeno parecido nos comentários. Comentários curtos e sarcásticos têm muito mais repercussão do que textos longos e analíticos.
    Comentários longos e caprichados acabam ignorados, enquanto comentários curtos escritos no impulso às vezes “explodem”, o que é frustrante

    • Meu karma é 104.872. As páginas HN Leaders e Best Comments são interessantes.
      O HN não gosta de piadas, exceto quando vêm acompanhadas de explicação
    • Texto longo nem sempre é melhor. Existe a estética da concisão. Causar impacto com 20 caracteres em vez de 2.000 é mais difícil e tem mais valor
    • Eu também uso duas contas, e a conta de comentários emocionais ou impulsivos tem eficiência de karma 4 vezes maior do que a principal. Mas a média é menor e a variância é maior
    • Essa ideia de que “bom conteúdo não é recompensado” talvez signifique que não estamos produzindo um conteúdo tão bom quanto imaginamos.
      Acho que dá para sentir melhor esse critério de engajamento quando se mantém um blog
    • Isso me fez querer mudar meu hábito de dar upvote. Fico pensando se, no HN, um upvote silencioso é uma forma de expressar concordância
  • Se “negativo” inclui crítica técnica, insatisfação com a indústria e frustração com APIs, então a maior parte das discussões no HN entra nessa categoria.
    Comentar só “gostei” num texto promocional da OpenAI não agrega nada; análise crítica é justamente o tipo de participação valiosa.
    Acho que posts populares sem comentários são, na verdade, prova de que o site está funcionando bem

    • Gosto do fato de que ele apresentou os dados e deixou a interpretação para os leitores
    • Concordo que é preciso separar “negatividade” em crítica vs. toxicidade. Misturar os dois conceitos é um erro
  • Nós mesmos filtramos para preferir reações negativas. Conteúdo positivo é mais autocontido e não estimula resposta, enquanto conteúdo negativo provoca interação

    • Pela estrutura do site, comentários simplesmente positivos são substituídos pelo botão de upvote
    • Comentários só dizendo “gostei” são vistos como inúteis, então o resultado é que há mais comentários neutros ou críticos
    • Os humanos são evolutivamente sensíveis a estímulos negativos. Quem ignorava perigos não sobreviveu.
      Por isso somos mais atraídos por notícias negativas e apenas passamos por cima das positivas. Esse é o cerne da economia da atenção
    • Eu aprendo mais com comentários que acrescentam informação do que com crítica destrutiva. Esse tipo de texto costuma ser mais novo e mais especializado
    • (Em tom de piada) “Isso mesmo! … ah, espera aí”
  • Crítica técnica é diferente de ataque pessoal. A negatividade do HN é, em sua maior parte, crítica construtiva.
    Quando o cinismo passa do ponto, inevitavelmente aparece “reclamação sobre a reclamação”.
    Eu prefiro ouvir “você está com algo preso no dente” a receber elogios

    • O artigo precisa tratar essa distinção com mais clareza. O modelo não consegue diferenciar “o design desta API está errado” de “esta empresa é horrível”.
      Como a moderação do HN remove rapidamente conteúdo hostil, o que sobra é, na maioria das vezes, crítica produtiva.
      O ponto interessante é que essa “negatividade” está associada a 27% mais engajamento. Ou seja, comunidades técnicas valorizam crítica mais do que propaganda
      Vou deixar explícito no artigo que “sentimento negativo” significa crítica avaliativa segundo o modelo SST-2, e não fala tóxica
    • Cinismo não é uma filosofia de dizer a verdade. Dizer fatos não é crítica
  • Quando o acesso à API do Reddit ainda era possível, fiz um experimento no app leitor rif bloqueando subreddits de sentimento negativo.
    Depois de bloquear centenas deles, sobraram apenas conteúdos positivos sobre animais e hobbies. Percebi o quanto o Reddit é centrado na negatividade e, ao mesmo tempo, que sem isso ele fica até meio entediante
    Link da lista de bloqueio

    • A atmosfera cínica do Reddit é como uma epidemia. Pessoas infelizes se juntam e reforçam o desespero umas das outras. Em sua maioria são jovens e menos experientes
    • O fato de conteúdo controverso gerar mais discussão é da natureza humana. Você ouve longamente sobre problemas amorosos de um amigo, mas quando está tudo bem não há muito o que dizer
    • Eu também evito política e conteúdo provocativo, e vejo só posts de hobbies ou criação. O Reddit realmente é um espaço muito misturado
    • Acho que uma proporção de 45:65 entre positivo/negativo é o equilíbrio mais interessante. Se fosse 50:50, o conteúdo ficaria comum demais. Nesse ponto, o HN é melhor do que rede social
    • Ainda uso rif. Troquei a chave da API com o Revanced para continuar usando. Como aumentaram os posts-isca para IA no Reddit, bloqueei os subreddits relacionados.
      Esses posts dão uma sensação de bots conversando com bots. Suspeito que o Reddit deixa essa estrutura existir para aumentar a exibição de anúncios
  • Na internet, não existe combinação mais poderosa do que reclamar ou corrigir alguém.
    Como usuário de ESL (English as a Second Language), um dos primeiros termos de internet que aprendi foi “flamewar”

    • Teve até gente perguntando o que era ESL
  • Segundo o artigo, a desigualdade de atenção no HN é muito severa. O coeficiente de Gini é 0,89, maior que o do Twitter
    Isso provavelmente se deve à estrutura de exposição do HN. Posts novos começam em /newest e, se não recebem atenção inicial de um pequeno grupo, praticamente desaparecem.
    Diferentemente do Reddit, onde existe uma exposição padrão, no HN é preciso passar pelo filtro inicial para chegar à página principal

    • Graças a essa estrutura, a reação inicial funciona como indicador preditivo de sucesso
  • Engenheiros trabalham resolvendo problemas, então naturalmente desenvolvem pensamento crítico.
    Em feiras do setor, os engenheiros abordavam tudo de braços cruzados e com frieza, enquanto a comunidade maker era cheia de energia positiva.
    No fim, é a diferença entre “o copo está meio vazio” e “o copo está meio cheio”