A internet agora é um espaço onde máquinas conversam entre si
- A internet deixou de ser um ambiente de uso simples, onde pessoas faziam perguntas e respondiam umas às outras, e passou a ser um espaço repleto de informações incorretas geradas por IA.
- Usuários do Google descobriram que o Google informava erroneamente que ovos podem derreter. Isso foi resultado de o Google, em vez de mostrar diretamente os sites, oferecer snapshots das páginas em menus suspensos, permitindo que o usuário leia os resultados de busca sem clicar.
- Recentemente, a inutilidade da Busca do Google tem aumentado; por exemplo, houve casos em que uma pesquisa por sinusite crônica retornou resultados sobre um pênis inflamado.
“Roubo” de tráfego da internet e a polêmica dos artigos com IA da Sports Illustrated
- Ontem, um usuário do Twitter alegou “roubo” de tráfego da internet. Ele examinou o índice de sites concorrentes, extraiu URLs de artigos e, em seguida, usou IA para escrever rapidamente matérias.
- Também foi revelado que a Sports Illustrated publicou artigos escritos por IA e os atribuiu a nomes de pessoas que, na realidade, não existiam. Após questionamentos sobre o caso, esse conteúdo foi removido.
A destruição fundamental da internet
- A internet não é mais um espaço de comunicação entre pessoas, mas se degenerou em um ambiente onde máquinas conversam entre si.
- A expressão “pergunta para o Google” agora perdeu o sentido. A chance de receber informação incorreta ou pura ficção ficou muito maior.
- Empresas como a Sports Illustrated estão mais interessadas em melhorar sua posição nos resultados de busca do Google e sua receita com anúncios do que em prestar serviço aos leitores.
Opinião do GN⁺
- A qualidade das informações na internet está piorando cada vez mais, o que causa confusão e desconforto aos usuários.
- Como um dos efeitos colaterais do avanço da tecnologia de IA, ficou mais difícil encontrar informações confiáveis por causa do volume de conteúdo incorreto gerado por IA.
- Essas mudanças fazem os usuários repensarem a forma como obtêm informações na internet e sugerem a necessidade de novas abordagens para garantir a qualidade da informação.
1 comentários
Comentários do Hacker News
Um dos problemas que surgiram com a disseminação dos Large Language Models (LLMs) é que antes havia uma heurística útil para descartar rapidamente posts sem valor por erros de ortografia ou gramática, mas agora esse método não funciona mais, porque o conteúdo gerado por IA tem domínio perfeito da linguagem. Por exemplo, houve problemas no projeto curl por causa de relatórios de bug falsos gerados por IA. Espera-se que esse problema fique ainda mais grave no futuro.
Há também a opinião de que, embora concordem com a mudança da internet, ela não é tão diferente de antes do GPT-4, 3 e 2. Artigos sobre temas genéricos escritos por estagiários ou assistentes virtuais da Índia são, em sua maioria, tão ruins quanto conteúdo gerado por IA e difíceis de distinguir. Também é um problema o fato de mecanismos de busca classificarem com base em reputação, mais do que na correspondência entre o texto da página e a consulta. As pessoas agora vivem em apps, não na web, e a qualidade da web vem piorando há muito tempo, mas em breve isso deixará de importar. Se a internet continuar existindo, espera-se que ela evolua para uma nova camada anonimizada e que passe a exigir trocas monetárias com frequência para reduzir a geração de conteúdo de baixa qualidade.
Diante da gravidade da situação atual da clearnet, também há quem ache que não é tão ruim ver a informação isolada dentro do Discord. Por não ser indexada por mecanismos de busca, ela evita aparecer junto com lixo de IA ou ser usada como dado de treinamento. O futuro da internet depende das pessoas, e nas máquinas já não dá para confiar nem mesmo para tarefas básicas.
Foi compartilhada uma experiência no projeto BeamMP com relatórios de bug falsos e PRs (pull requests) gerados por IA. Esses materiais gerados por IA são fáceis de identificar e têm características como alterar código relacionado ou apresentar soluções que nem compilam. Pessoas de verdade são preguiçosas e não fazem trabalho desnecessário; como esse lixo gerado por IA é perda de tempo, ele não é mesclado.
É importante manter a autenticidade na internet. Só conteúdo assinado pode garantir autenticidade. Em um cenário em que a IA pode publicar cada vez mais, a única forma de filtrar é depender de confiança e autenticidade, sabendo quem publicou o quê e o que essa pessoa está dizendo. A Web of Trust já foi tentada, mas não chegou ao mainstream, e talvez seja hora de tentar de novo.
Há também opiniões de que se trata de um problema antigo que os LLMs apenas aceleraram. À medida que o Google buscou aumentar sua receita com anúncios e o domínio da adtech, SEO se espalhou pelos resultados de busca, tornando mais difícil obter informação objetiva. Buscar primeiro no Reddit pode ser uma solução, mas o próprio Reddit também tem ficado cheio de conteúdo manipulado nos últimos anos.
Há quem diga que a internet já estava cheia de lixo gerado por humanos por causa de SEO, então a chegada da “IA” não fez com que se perdesse muita coisa na prática. Também há pessoas que apontam esse problema no setor há muito tempo.
No fim, propaganda existe para ganhar dinheiro, o que significa dinheiro vindo de humanos, a menos que bots tenham cartão de crédito. Empresas como o Google, mesmo que tenham aumento de tráfego, sentirão o impacto financeiramente se isso não se converter em gasto humano. As grandes demissões recentes no setor de tecnologia podem indicar que a reação a esse problema já começou.
Há também a opinião de que, se você leu o livro "Anathem", nossa missão é filtrar o lixo do Reticulum.