6 pontos por GN⁺ 2024-01-12 | 1 comentários | Compartilhar no WhatsApp

A internet agora é um espaço onde máquinas conversam entre si

  • A internet deixou de ser um ambiente de uso simples, onde pessoas faziam perguntas e respondiam umas às outras, e passou a ser um espaço repleto de informações incorretas geradas por IA.
  • Usuários do Google descobriram que o Google informava erroneamente que ovos podem derreter. Isso foi resultado de o Google, em vez de mostrar diretamente os sites, oferecer snapshots das páginas em menus suspensos, permitindo que o usuário leia os resultados de busca sem clicar.
  • Recentemente, a inutilidade da Busca do Google tem aumentado; por exemplo, houve casos em que uma pesquisa por sinusite crônica retornou resultados sobre um pênis inflamado.

“Roubo” de tráfego da internet e a polêmica dos artigos com IA da Sports Illustrated

  • Ontem, um usuário do Twitter alegou “roubo” de tráfego da internet. Ele examinou o índice de sites concorrentes, extraiu URLs de artigos e, em seguida, usou IA para escrever rapidamente matérias.
  • Também foi revelado que a Sports Illustrated publicou artigos escritos por IA e os atribuiu a nomes de pessoas que, na realidade, não existiam. Após questionamentos sobre o caso, esse conteúdo foi removido.

A destruição fundamental da internet

  • A internet não é mais um espaço de comunicação entre pessoas, mas se degenerou em um ambiente onde máquinas conversam entre si.
  • A expressão “pergunta para o Google” agora perdeu o sentido. A chance de receber informação incorreta ou pura ficção ficou muito maior.
  • Empresas como a Sports Illustrated estão mais interessadas em melhorar sua posição nos resultados de busca do Google e sua receita com anúncios do que em prestar serviço aos leitores.

Opinião do GN⁺

  • A qualidade das informações na internet está piorando cada vez mais, o que causa confusão e desconforto aos usuários.
  • Como um dos efeitos colaterais do avanço da tecnologia de IA, ficou mais difícil encontrar informações confiáveis por causa do volume de conteúdo incorreto gerado por IA.
  • Essas mudanças fazem os usuários repensarem a forma como obtêm informações na internet e sugerem a necessidade de novas abordagens para garantir a qualidade da informação.

1 comentários

 
GN⁺ 2024-01-12
Comentários do Hacker News
  • Um dos problemas que surgiram com a disseminação dos Large Language Models (LLMs) é que antes havia uma heurística útil para descartar rapidamente posts sem valor por erros de ortografia ou gramática, mas agora esse método não funciona mais, porque o conteúdo gerado por IA tem domínio perfeito da linguagem. Por exemplo, houve problemas no projeto curl por causa de relatórios de bug falsos gerados por IA. Espera-se que esse problema fique ainda mais grave no futuro.

  • Há também a opinião de que, embora concordem com a mudança da internet, ela não é tão diferente de antes do GPT-4, 3 e 2. Artigos sobre temas genéricos escritos por estagiários ou assistentes virtuais da Índia são, em sua maioria, tão ruins quanto conteúdo gerado por IA e difíceis de distinguir. Também é um problema o fato de mecanismos de busca classificarem com base em reputação, mais do que na correspondência entre o texto da página e a consulta. As pessoas agora vivem em apps, não na web, e a qualidade da web vem piorando há muito tempo, mas em breve isso deixará de importar. Se a internet continuar existindo, espera-se que ela evolua para uma nova camada anonimizada e que passe a exigir trocas monetárias com frequência para reduzir a geração de conteúdo de baixa qualidade.

  • Diante da gravidade da situação atual da clearnet, também há quem ache que não é tão ruim ver a informação isolada dentro do Discord. Por não ser indexada por mecanismos de busca, ela evita aparecer junto com lixo de IA ou ser usada como dado de treinamento. O futuro da internet depende das pessoas, e nas máquinas já não dá para confiar nem mesmo para tarefas básicas.

  • Foi compartilhada uma experiência no projeto BeamMP com relatórios de bug falsos e PRs (pull requests) gerados por IA. Esses materiais gerados por IA são fáceis de identificar e têm características como alterar código relacionado ou apresentar soluções que nem compilam. Pessoas de verdade são preguiçosas e não fazem trabalho desnecessário; como esse lixo gerado por IA é perda de tempo, ele não é mesclado.

  • É importante manter a autenticidade na internet. Só conteúdo assinado pode garantir autenticidade. Em um cenário em que a IA pode publicar cada vez mais, a única forma de filtrar é depender de confiança e autenticidade, sabendo quem publicou o quê e o que essa pessoa está dizendo. A Web of Trust já foi tentada, mas não chegou ao mainstream, e talvez seja hora de tentar de novo.

  • Há também opiniões de que se trata de um problema antigo que os LLMs apenas aceleraram. À medida que o Google buscou aumentar sua receita com anúncios e o domínio da adtech, SEO se espalhou pelos resultados de busca, tornando mais difícil obter informação objetiva. Buscar primeiro no Reddit pode ser uma solução, mas o próprio Reddit também tem ficado cheio de conteúdo manipulado nos últimos anos.

  • Há quem diga que a internet já estava cheia de lixo gerado por humanos por causa de SEO, então a chegada da “IA” não fez com que se perdesse muita coisa na prática. Também há pessoas que apontam esse problema no setor há muito tempo.

  • No fim, propaganda existe para ganhar dinheiro, o que significa dinheiro vindo de humanos, a menos que bots tenham cartão de crédito. Empresas como o Google, mesmo que tenham aumento de tráfego, sentirão o impacto financeiramente se isso não se converter em gasto humano. As grandes demissões recentes no setor de tecnologia podem indicar que a reação a esse problema já começou.

  • Há também a opinião de que, se você leu o livro "Anathem", nossa missão é filtrar o lixo do Reticulum.