PhysicsForums e a teoria da internet morta
(hallofdreams.org)O futuro da internet
- PhysicsForums é um fórum de ciência fundado em 2001, com foco em oferecer dicas para estudantes sobre tarefas de física.
- Cresceu de forma constante até 2012, mas depois entrou em declínio por causa de sites centralizados como o StackExchange.
- Até 2025, funciona como uma cápsula do tempo que permite vislumbrar a internet do passado, por não ter mudado as URLs nem apagado publicações.
A história de Ravenprp
- Ravenprp é um usuário que escreveu 2.891 publicações ao longo de 7 meses entre 2006 e 2007, descrito como alguém com conhecimento em várias áreas.
- Porém, na realidade, ele escreveu apenas 74 publicações, e o restante parece ter sido adicionado depois.
A internet é eterna
- O PhysicsForums se fundiu com o MathHelpBoards e integrou 150 mil publicações, processo no qual o banco de dados foi modificado.
- Em 2023 e 2024, foram adicionadas 115.000 publicações escritas por LLMs (modelos de linguagem de grande porte).
A teoria da internet morta
- A "teoria da internet morta" afirma que grande parte da internet é composta por entidades que não são humanas.
- Com a chegada dos LLMs, cada vez mais conteúdo da internet está sendo gerado por máquinas em vez de contribuições humanas.
Humanos vs. máquinas
- A comunidade do PhysicsForums expressou preocupação com conteúdo gerado por IA, como o ChatGPT.
- O conteúdo gerado por IA não atendeu aos padrões de qualidade do site, e o experimento terminou em fracasso.
A internet são as pessoas
- Greg Bernhardt pretende melhorar ou remover os recursos de IA com base no feedback da comunidade.
- Adicionar conteúdo gerado por LLM a contas de usuários existentes dilui a identidade desses usuários e distorce o registro histórico da internet.
Este texto aborda as mudanças no PhysicsForums e a evolução da internet, explorando o impacto da IA sobre o conteúdo da internet.
1 comentários
Opinião do Hacker News
Aumento da percepção negativa sobre conteúdo gerado por LLM: muitas pessoas não querem conteúdo gerado por IA. Em blogs ou fóruns, querem ver textos escritos por humanos. Estão gastando muito tempo e energia para evitar conteúdo gerado por IA. Se o Google tivesse um filtro de "remover conteúdo gerado", elas gostariam de usá-lo. Pesquisas mostram que, ao reconhecer conteúdo gerado por IA, há uma tendência imediata de rejeição. Isso incentiva editoras a fazer uma espécie de "lavagem humana", fazendo conteúdo escrito por IA parecer ter sido escrito por pessoas.
Declínio dos fóruns e blogs tradicionais: desde 2012, o crescimento de fóruns e blogs tradicionais desacelerou. O Google começou a rebaixar sites que não fossem grandes plataformas, independentemente da qualidade. Ainda assim, alguns fóruns continuam no ar sem mudar a URL nem apagar posts antigos.
Mudanças no PhysicsForums: o PhysicsForums era um site muito usado no passado, mas perdeu visitas com a ascensão das redes sociais. O arquivo ainda é útil, e o fato de um link não ser compartilhado no Twitter não significa que ninguém se importe.
Diferença entre fóruns e sites centralizados: pessoas dos EUA e da Europa gostam de vários fóruns de nicho, enquanto chineses preferem sites centralizados. O Zhihu começou como um clone do Quora, mas hoje se tornou o maior site para discussões profundas sobre vários temas. Já a qualidade do Quora caiu com o tempo.
O problema dos comentários gerados por IA: o dono do site admitiu ter adicionado comentários de IA com data retroativa. Existe uma teoria da "economia morta" em que IAs enviam, leem e rejeitam currículos. A interação humana é importante, e conteúdo gerado por IA atrapalha isso.
O contrato social das comunidades online: ao criar uma conta em uma comunidade online, existe a expectativa de interagir principalmente com pessoas. Porém, interagir com usuários gerados por IA faz o valor da interação humana se perder.
A dificuldade de operar fóruns: quando usuários não participam de um fórum ou blog, o operador acaba criando tópicos e escrevendo respostas por conta própria. Isso às vezes leva a problemas como anúncios de spam.
Problemas de confiança e atribuição: questões de confiança e atribuição sempre existiram na web, mas agora ficaram mais graves. É preciso uma solução.
Privacidade e questões legais: surgiu a necessidade de registrar uma marca para proteger o próprio nome ou handle. Também se considera usar PKI para assinar e verificar publicações.