1 pontos por GN⁺ 2025-01-26 | 1 comentários | Compartilhar no WhatsApp

O futuro da internet

  • PhysicsForums é um fórum de ciência fundado em 2001, com foco em oferecer dicas para estudantes sobre tarefas de física.
  • Cresceu de forma constante até 2012, mas depois entrou em declínio por causa de sites centralizados como o StackExchange.
  • Até 2025, funciona como uma cápsula do tempo que permite vislumbrar a internet do passado, por não ter mudado as URLs nem apagado publicações.

A história de Ravenprp

  • Ravenprp é um usuário que escreveu 2.891 publicações ao longo de 7 meses entre 2006 e 2007, descrito como alguém com conhecimento em várias áreas.
  • Porém, na realidade, ele escreveu apenas 74 publicações, e o restante parece ter sido adicionado depois.

A internet é eterna

  • O PhysicsForums se fundiu com o MathHelpBoards e integrou 150 mil publicações, processo no qual o banco de dados foi modificado.
  • Em 2023 e 2024, foram adicionadas 115.000 publicações escritas por LLMs (modelos de linguagem de grande porte).

A teoria da internet morta

  • A "teoria da internet morta" afirma que grande parte da internet é composta por entidades que não são humanas.
  • Com a chegada dos LLMs, cada vez mais conteúdo da internet está sendo gerado por máquinas em vez de contribuições humanas.

Humanos vs. máquinas

  • A comunidade do PhysicsForums expressou preocupação com conteúdo gerado por IA, como o ChatGPT.
  • O conteúdo gerado por IA não atendeu aos padrões de qualidade do site, e o experimento terminou em fracasso.

A internet são as pessoas

  • Greg Bernhardt pretende melhorar ou remover os recursos de IA com base no feedback da comunidade.
  • Adicionar conteúdo gerado por LLM a contas de usuários existentes dilui a identidade desses usuários e distorce o registro histórico da internet.

Este texto aborda as mudanças no PhysicsForums e a evolução da internet, explorando o impacto da IA sobre o conteúdo da internet.

1 comentários

 
GN⁺ 2025-01-26
Opinião do Hacker News
  • Aumento da percepção negativa sobre conteúdo gerado por LLM: muitas pessoas não querem conteúdo gerado por IA. Em blogs ou fóruns, querem ver textos escritos por humanos. Estão gastando muito tempo e energia para evitar conteúdo gerado por IA. Se o Google tivesse um filtro de "remover conteúdo gerado", elas gostariam de usá-lo. Pesquisas mostram que, ao reconhecer conteúdo gerado por IA, há uma tendência imediata de rejeição. Isso incentiva editoras a fazer uma espécie de "lavagem humana", fazendo conteúdo escrito por IA parecer ter sido escrito por pessoas.

  • Declínio dos fóruns e blogs tradicionais: desde 2012, o crescimento de fóruns e blogs tradicionais desacelerou. O Google começou a rebaixar sites que não fossem grandes plataformas, independentemente da qualidade. Ainda assim, alguns fóruns continuam no ar sem mudar a URL nem apagar posts antigos.

  • Mudanças no PhysicsForums: o PhysicsForums era um site muito usado no passado, mas perdeu visitas com a ascensão das redes sociais. O arquivo ainda é útil, e o fato de um link não ser compartilhado no Twitter não significa que ninguém se importe.

  • Diferença entre fóruns e sites centralizados: pessoas dos EUA e da Europa gostam de vários fóruns de nicho, enquanto chineses preferem sites centralizados. O Zhihu começou como um clone do Quora, mas hoje se tornou o maior site para discussões profundas sobre vários temas. Já a qualidade do Quora caiu com o tempo.

  • O problema dos comentários gerados por IA: o dono do site admitiu ter adicionado comentários de IA com data retroativa. Existe uma teoria da "economia morta" em que IAs enviam, leem e rejeitam currículos. A interação humana é importante, e conteúdo gerado por IA atrapalha isso.

  • O contrato social das comunidades online: ao criar uma conta em uma comunidade online, existe a expectativa de interagir principalmente com pessoas. Porém, interagir com usuários gerados por IA faz o valor da interação humana se perder.

  • A dificuldade de operar fóruns: quando usuários não participam de um fórum ou blog, o operador acaba criando tópicos e escrevendo respostas por conta própria. Isso às vezes leva a problemas como anúncios de spam.

  • Problemas de confiança e atribuição: questões de confiança e atribuição sempre existiram na web, mas agora ficaram mais graves. É preciso uma solução.

  • Privacidade e questões legais: surgiu a necessidade de registrar uma marca para proteger o próprio nome ou handle. Também se considera usar PKI para assinar e verificar publicações.