Ferramenta para pesquisar apenas conteúdo criado antes do lançamento do ChatGPT

(tegabrain.com)

16 pontos por GN⁺ 2025-12-02 | 1 comentários | Compartilhar no WhatsApp

Uma extensão de navegador criada para evitar a contaminação por conteúdo gerado por IA, projetada para pesquisar apenas conteúdo escrito por humanos
Usa a API de Busca do Google para retornar apenas resultados publicados antes de 30 de novembro de 2022
Disponível para download e uso no Chrome e no Firefox
Parte do contexto de que, após o surgimento do ChatGPT e de outros grandes modelos de linguagem, houve um aumento explosivo de textos, imagens e vídeos gerados por IA na internet
Oferece um ambiente de busca confiável para usuários que querem acessar apenas materiais feitos por humanos

Visão geral do Slop Evader

Slop Evader é uma extensão de navegador para evitar conteúdo gerado por IA, disponível para Chrome e Firefox
- Os usuários podem instalar a extensão para filtrar conteúdo criado por IA
A ferramenta exibe nos resultados de busca apenas conteúdos criados antes do lançamento do ChatGPT (30 de novembro de 2022)
- Ela usa a API de Busca do Google para restringir os resultados com base na data

Contexto de desenvolvimento

Após o lançamento do ChatGPT e de outros grandes modelos de linguagem (LLM), a quantidade de textos, imagens e vídeos criados por IA na internet aumentou rapidamente
O Slop Evader foi criado para evitar essa poluição informacional online causada por conteúdo gerado por IA
Com essa extensão, os usuários podem navegar apenas por conteúdo escrito ou produzido diretamente por humanos

Funcionalidades e relevância

Ao limitar os resultados de busca a publicações anteriores a 30 de novembro de 2022, a ferramenta minimiza o impacto de conteúdo gerado por IA
Funciona com base na API de Busca do Google, mantendo uma experiência de uso semelhante à da busca tradicional
Em meio à disseminação de conteúdo de IA, atua como uma ferramenta que garante acesso à informação centrado em conteúdo humano

1 comentários

GN⁺ 2025-12-02

Opinião no Hacker News

Dizem que esta é uma ferramenta que busca apenas conteúdo publicado antes do lançamento do ChatGPT (30 de novembro de 2022)
Mas parece que a queda na qualidade da busca começou muito antes disso
Não só o Google, mas todos os mecanismos de busca já estavam piorando, e depois a IA acelerou essa tendência de queda
Em especial, foi um problema tentar enfiar à força a UI de busca do YouTube na busca do Google
O que o usuário quer são resultados exatos, não “xyz que outras pessoas pesquisaram”, mas anúncios e elementos para gerar cliques só aumentaram a confusão da UI
- Queria perguntar se conhecem o mecanismo de busca Kagi
  Lá dá para desativar completamente os recursos de IA
  Atualmente tem cerca de 61 mil membros e cresce em 2 mil por mês (link das estatísticas)
- Na verdade, conteúdo gerado automaticamente já existia antes do ChatGPT
  Por volta de 2020 já havia muitas páginas de SEO cheias de conteúdo raspado ou spam de palavras-chave
  Também havia muitos textos feitos com modelos de linguagem simples ou cadeias de Markov
- Parodiando a frase “Google made the search results worse”, fazem piada com autocompletar como “worse results near me” e “best worse results”
- Aponta-se que o objetivo do Google não é o usuário encontrar informação, mas aumentar o tempo de permanência
  E ironizam que isso é embalado em linguagem corporativa para justificar tornar a vida das pessoas mais inconveniente
- Eu uso DuckDuckGo há mais de 10 anos
  Uso principalmente para buscar documentação de programação, e os resultados ainda são bem precisos
  Talvez seja porque meu padrão de busca é simples, mas o DDG ainda vale a pena
Alguém disse que “estamos minerando ‘tokens de baixo ruído’, como o aço de baixo background radioativo (low-background steel) do pós-Segunda Guerra Mundial”, e essa metáfora não sai da minha cabeça
Organizei a ideia neste texto do Latent Space
Não tenho certeza se tokens feitos por humanos são mesmo mais “alto sinal” do que os feitos por IA
- Na prática, aço de baixo background radioativo não é mais necessário
  Segundo a explicação da Wikipédia, isso acontece porque o nível de radiação caiu o suficiente após o Tratado de Proibição Parcial de Testes Nucleares de 1963
- Hoje em dia, dados sintéticos já são tão comuns que essa ideia nem parece nova
- “Quem disse isso fui eu, swyx”, esclarece a pessoa
- As gerações humanas sempre construíram em cima do legado imperfeito das gerações anteriores
  Chamávamos isso de “subir nos ombros de gigantes”
Esse tipo de projeto faz lembrar o universo de Cyberpunk 2077
A história era de que a primeira internet foi contaminada por IAs perigosas, então ergueram um grande firewall e criaram uma nova internet centrada em humanos
Dá a impressão de que um dia talvez precisemos de uma internet só para humanos
Claro que, na prática, isso seria difícil, e dá para imaginar algo como uma rede meatspace-first em que fosse preciso comprovar continuamente que se é humano
- O problema é que é impossível verificar se o conteúdo realmente veio de pensamento humano
  A maior parte do conteúdo já foi influenciada por IA, e apenas consultar algo é diferente de fazer golpe de copiar e colar
- Como disse Nick Bostrom, uma tecnologia de disrupção civilizacional que já entrou no mundo não pode ser revertida
  No fim, temos de nos adaptar
  Acho que redes autônomas como Mastodon, Discord e Matrix apontam nessa direção
- As pessoas já estão migrando para grupos privados como Signal, WhatsApp e Telegram
- Cenários parecidos já apareceram na trilogia Starfish, de Peter Watts, e em Anathem, de Neal Stephenson
- Mesmo que houvesse uma “internet só para humanos”, ela perderia o sentido se os humanos continuassem sendo influenciados por IA
Existe um leaderboard do HN mostrando o ranking de uso de em dash (—) antes do ChatGPT
Link
- Sugerem incluir também quem usa double hyphen (--)
- Ao ver os comentários do usuário em primeiro lugar, notaram também o hábito de usar crase (`) no lugar de apóstrofo
- Também brincam dizendo que os usuários de en dash (–) mereciam alguma consideração
Esse recurso é possível mesmo sem extensão
Basta adicionar o filtro before: na busca do Google
Ex.: Happiness before:2022
Não sei se conteúdo gerado por IA é um problema tão grande assim
Na maior parte, ele só substituiu o antigo spam de SEO de content farms
Eu já não lia esse tipo de texto antes, e agora só ficou com frases um pouco mais fluidas
Se a higiene de busca estiver em ordem, acho que não há problema
Mas no r/chess do Reddit há muitos casos de gente postando respostas do ChatGPT como se fossem suas
- Um colega me enviou um relatório de bug escrito com ChatGPT, mas ele errou completamente o diagnóstico do bug
  Depois continuou a conversa também com ChatGPT e insistiu que eu era quem estava errado
  Esse futuro me preocupa
- Antes havia só uma ou duas respostas erradas, então era fácil filtrar
  Agora existem dezenas de respostas erradas idênticas, só com formato diferente
- Subreddits de ciência e tecnologia também estão lotados de repostagens do ChatGPT
  As pessoas publicam achando que descobriram um avanço filosófico
  Lugares como /r/localllama também têm muito spam de IA, e alguns “Show HN” no HN são portfólios falsos feitos por LLM
  Eu mesmo já perdi tempo com esse tipo de post
- O spam antigo de SEO ao menos era baseado em fatos
  Em sites de receita, por exemplo, ainda dava para pular as partes desnecessárias
  Mas agora quase toda busca está coberta por frases geradas por IA
  Antes era possível obter resultados precisos com buscas raras, mas agora é preciso atravessar um monte de páginas sem sentido
- Em resposta, dizem que antes, se alguém escrevia um bom texto, o mecanismo de busca o encontrava naturalmente
  Agora esse texto humano é absorvido como dado de treinamento de LLM e reaproveitado na próxima geração de conteúdo de IA
  Isso acontece mesmo sem consentimento
A expressão “aço de baixo background radioativo da internet” é interessante
Link relacionado na Wikipédia
- O mesmo tema já foi mencionado no HN há meio ano
Isso aconteceu enquanto eu fazia pesquisa com o ChatGPT
- Ele alucinou com confiança uma resposta errada
- Guardou esse conteúdo na memória e continuou sustentando a informação
- Quando pedi as fontes, citou a si mesmo com dois artigos falsos criados por IA
  No fim, resolvi o problema encontrando um documento escrito por um humano na instituição que era a fonte original
  Esse tipo de coisa acontece com frequência nas fronteiras do conhecimento
- IA parece mexer em respostas do Stack Overflow
  A primeira resposta pode estar certa ou não
  Mas o chatbot tem dificuldade de sair de uma direção errada
- Uma solução simples é fazer a mesma pergunta a 3 LLMs diferentes
  Se os resultados coincidirem, considera-se menor a chance de alucinação
Para busca de imagens, same.energy é bom
Está meio abandonado há anos, mas ainda funciona, e quase não há imagens geradas por IA
O produto em si também é muito bom
Os resultados do Google já eram 90% lixo de SEO antes do ChatGPT
É só usar Kagi e bloquear sites de SEO
- Mas fico curioso sobre como o Kagi distingue sites de SEO
  Queria saber se existe uma lista de filtros ou algum critério de classificação

Ferramenta para pesquisar apenas conteúdo criado antes do lançamento do ChatGPT

Visão geral do Slop Evader

Contexto de desenvolvimento

Funcionalidades e relevância

Leituras relacionadas

1 comentários

Opinião no Hacker News