- Uma extensão de navegador criada para evitar a contaminação por conteúdo gerado por IA, projetada para pesquisar apenas conteúdo escrito por humanos
- Usa a API de Busca do Google para retornar apenas resultados publicados antes de 30 de novembro de 2022
- Disponível para download e uso no Chrome e no Firefox
- Parte do contexto de que, após o surgimento do ChatGPT e de outros grandes modelos de linguagem, houve um aumento explosivo de textos, imagens e vídeos gerados por IA na internet
- Oferece um ambiente de busca confiável para usuários que querem acessar apenas materiais feitos por humanos
Visão geral do Slop Evader
- Slop Evader é uma extensão de navegador para evitar conteúdo gerado por IA, disponível para Chrome e Firefox
- Os usuários podem instalar a extensão para filtrar conteúdo criado por IA
- A ferramenta exibe nos resultados de busca apenas conteúdos criados antes do lançamento do ChatGPT (30 de novembro de 2022)
- Ela usa a API de Busca do Google para restringir os resultados com base na data
Contexto de desenvolvimento
- Após o lançamento do ChatGPT e de outros grandes modelos de linguagem (LLM), a quantidade de textos, imagens e vídeos criados por IA na internet aumentou rapidamente
- O Slop Evader foi criado para evitar essa poluição informacional online causada por conteúdo gerado por IA
- Com essa extensão, os usuários podem navegar apenas por conteúdo escrito ou produzido diretamente por humanos
Funcionalidades e relevância
- Ao limitar os resultados de busca a publicações anteriores a 30 de novembro de 2022, a ferramenta minimiza o impacto de conteúdo gerado por IA
- Funciona com base na API de Busca do Google, mantendo uma experiência de uso semelhante à da busca tradicional
- Em meio à disseminação de conteúdo de IA, atua como uma ferramenta que garante acesso à informação centrado em conteúdo humano
1 comentários
Opinião no Hacker News
Dizem que esta é uma ferramenta que busca apenas conteúdo publicado antes do lançamento do ChatGPT (30 de novembro de 2022)
Mas parece que a queda na qualidade da busca começou muito antes disso
Não só o Google, mas todos os mecanismos de busca já estavam piorando, e depois a IA acelerou essa tendência de queda
Em especial, foi um problema tentar enfiar à força a UI de busca do YouTube na busca do Google
O que o usuário quer são resultados exatos, não “xyz que outras pessoas pesquisaram”, mas anúncios e elementos para gerar cliques só aumentaram a confusão da UI
Lá dá para desativar completamente os recursos de IA
Atualmente tem cerca de 61 mil membros e cresce em 2 mil por mês (link das estatísticas)
Por volta de 2020 já havia muitas páginas de SEO cheias de conteúdo raspado ou spam de palavras-chave
Também havia muitos textos feitos com modelos de linguagem simples ou cadeias de Markov
E ironizam que isso é embalado em linguagem corporativa para justificar tornar a vida das pessoas mais inconveniente
Uso principalmente para buscar documentação de programação, e os resultados ainda são bem precisos
Talvez seja porque meu padrão de busca é simples, mas o DDG ainda vale a pena
Alguém disse que “estamos minerando ‘tokens de baixo ruído’, como o aço de baixo background radioativo (low-background steel) do pós-Segunda Guerra Mundial”, e essa metáfora não sai da minha cabeça
Organizei a ideia neste texto do Latent Space
Não tenho certeza se tokens feitos por humanos são mesmo mais “alto sinal” do que os feitos por IA
Segundo a explicação da Wikipédia, isso acontece porque o nível de radiação caiu o suficiente após o Tratado de Proibição Parcial de Testes Nucleares de 1963
Chamávamos isso de “subir nos ombros de gigantes”
Esse tipo de projeto faz lembrar o universo de Cyberpunk 2077
A história era de que a primeira internet foi contaminada por IAs perigosas, então ergueram um grande firewall e criaram uma nova internet centrada em humanos
Dá a impressão de que um dia talvez precisemos de uma internet só para humanos
Claro que, na prática, isso seria difícil, e dá para imaginar algo como uma rede meatspace-first em que fosse preciso comprovar continuamente que se é humano
A maior parte do conteúdo já foi influenciada por IA, e apenas consultar algo é diferente de fazer golpe de copiar e colar
No fim, temos de nos adaptar
Acho que redes autônomas como Mastodon, Discord e Matrix apontam nessa direção
Existe um leaderboard do HN mostrando o ranking de uso de em dash (—) antes do ChatGPT
Link
Esse recurso é possível mesmo sem extensão
Basta adicionar o filtro
before:na busca do GoogleEx.: Happiness before:2022
Não sei se conteúdo gerado por IA é um problema tão grande assim
Na maior parte, ele só substituiu o antigo spam de SEO de content farms
Eu já não lia esse tipo de texto antes, e agora só ficou com frases um pouco mais fluidas
Se a higiene de busca estiver em ordem, acho que não há problema
Mas no r/chess do Reddit há muitos casos de gente postando respostas do ChatGPT como se fossem suas
Depois continuou a conversa também com ChatGPT e insistiu que eu era quem estava errado
Esse futuro me preocupa
Agora existem dezenas de respostas erradas idênticas, só com formato diferente
As pessoas publicam achando que descobriram um avanço filosófico
Lugares como /r/localllama também têm muito spam de IA, e alguns “Show HN” no HN são portfólios falsos feitos por LLM
Eu mesmo já perdi tempo com esse tipo de post
Em sites de receita, por exemplo, ainda dava para pular as partes desnecessárias
Mas agora quase toda busca está coberta por frases geradas por IA
Antes era possível obter resultados precisos com buscas raras, mas agora é preciso atravessar um monte de páginas sem sentido
Agora esse texto humano é absorvido como dado de treinamento de LLM e reaproveitado na próxima geração de conteúdo de IA
Isso acontece mesmo sem consentimento
A expressão “aço de baixo background radioativo da internet” é interessante
Link relacionado na Wikipédia
Isso aconteceu enquanto eu fazia pesquisa com o ChatGPT
No fim, resolvi o problema encontrando um documento escrito por um humano na instituição que era a fonte original
Esse tipo de coisa acontece com frequência nas fronteiras do conhecimento
A primeira resposta pode estar certa ou não
Mas o chatbot tem dificuldade de sair de uma direção errada
Se os resultados coincidirem, considera-se menor a chance de alucinação
Para busca de imagens, same.energy é bom
Está meio abandonado há anos, mas ainda funciona, e quase não há imagens geradas por IA
O produto em si também é muito bom
Os resultados do Google já eram 90% lixo de SEO antes do ChatGPT
É só usar Kagi e bloquear sites de SEO
Queria saber se existe uma lista de filtros ou algum critério de classificação