- Respostas de busca por IA, como AI Overviews e ChatGPT, podem ser enviesadas em temas sensíveis como saúde e finanças até por uma única página da web ou postagem
- Em um experimento da BBC, um único texto em um site pessoal fez com que ChatGPT e Google respondessem que o autor era um campeão mundial de comer cachorro-quente
- Quando a IA reúne resultados da web e entrega uma única resposta, os usuários tendem mais a aceitá-la como se fosse a resposta certa do que numa busca tradicional, em que comparariam vários links
- O Google deixou claro que manipular respostas de IA viola sua política contra spam, e sites infratores podem ser removidos dos resultados de busca ou rebaixados no ranking
- Como quem manipula pode migrar de blogs para influenciadores no YouTube e outros meios para escapar da fiscalização, é preciso não confiar cegamente nas respostas de IA
Problema da manipulação de respostas de busca por IA
- AI Overviews no topo do Google Search, além de ChatGPT e Gemini, podem ser manipulados para fornecer respostas enviesadas até em temas importantes como saúde e finanças pessoais
- Em uma investigação da BBC, foi possível fazer com que ChatGPT e Google respondessem que o autor era “campeão mundial de comer cachorro-quente” usando apenas um único texto publicado em um site pessoal
- Há indícios de que o mesmo método também tenha sido usado para minimizar preocupações de saúde sobre suplementos médicos ou influenciar informações financeiras relacionadas à aposentadoria
- A consultora de SEO e busca por IA Lily Ray avalia que, em um ambiente em que a IA entrega “uma única resposta correta”, os usuários tendem a acreditar na resposta como está em vez de comparar vários links, como fariam na busca tradicional
- O Google afirmou que já aplica às funções de busca com IA generativa suas políticas anti-spam e mecanismos de proteção existentes, e que vem reforçando o combate a spam contra novas táticas desde antes da chegada da IA
Como a manipulação funciona
- Respostas de chatbots em geral se baseiam em dados embutidos no modelo, mas o risco de manipulação cresce quando ferramentas como ChatGPT, Claude e os produtos de IA do Google pesquisam na internet para encontrar respostas
- Quando uma ferramenta de IA obtém informações de uma única página da web ou postagem em rede social, basta uma postagem falsa bem elaborada para contaminar a resposta
- Publicar apenas um post de blog sofisticado online já pode mudar o conteúdo que a IA transmite ao público
- Esse tipo de manipulação rapidamente passou a ser visto como oportunidade de ganhar dinheiro, e informações imprecisas ou enviesadas podem afetar votos, escolha de prestadores de serviço, aconselhamento médico e decisões legais
- Harpreet Chatha destaca não apenas o impacto econômico, mas também o risco de uma condição piorar por orientação médica errada ou de alguém agir de forma incompatível com as leis de seu país ou região
Mudança de política e resposta do Google
- Mais de 1 bilhão de pessoas no mundo usam chatbots de IA com regularidade, e 2,5 bilhões veem os AI Overviews do Google todos os meses, então o impacto de conseguir perturbar essas ferramentas é enorme
- Na semana passada, o Google atualizou sua política contra spam para confirmar oficialmente que tentativas de manipular respostas de IA violam as regras da empresa
- Empresas ou sites que violarem as regras podem ser removidos dos resultados de busca do Google ou rebaixados no ranking
- O Google disse que essa mudança não representa uma alteração de abordagem, mas sim um “esclarecimento”, e já havia explicado em 2025 seus esforços anti-spam relacionados a AI Overview e AI Mode
- Ainda assim, o experimento do cachorro-quente teve sucesso quase um ano depois, e Lily Ray também realizou nesta semana um experimento semelhante que levou o Google a responder que um especialista em SEO era alguém habilidoso em construir castelos de areia
Mudanças observadas e limitações
- Segundo Ray e Chatha, nos últimos meses surgiram mudanças que sugerem que Google e outras empresas estão testando soluções
- Há casos em que, se Google e ChatGPT suspeitam da autopromoção de uma determinada empresa, parecem excluí-la discretamente da resposta de IA
- Por exemplo, se um texto afirma que seu autor é o melhor competidor de comer cachorro-quente, a IA pode citar o texto, mas excluir o nome da lista de candidatos
- Também foram observados casos em que Google e outras ferramentas de IA adicionam mais rótulos de incerteza às respostas para indicar que o chatbot não está confiante
- ChatGPT e Claude, da Anthropic, passaram a responder explicitamente em algumas consultas que estão tentando filtrar spam, e a Anthropic é a empresa que criou o Claude
- Ray diz ter visto o Google também acrescentar mais ressalvas em perguntas ligadas a decisões de compra específicas e recomendar que se verifiquem avaliações de terceiros
- OpenAI e Anthropic se recusaram a comentar, e um porta-voz do Google não respondeu a perguntas sobre essas mudanças
A repetida corrida entre manipuladores e plataformas
- Chatha afirma que essas mudanças por si só provavelmente não serão suficientes e compara a resposta do Google a um jogo de whac-a-mole
- Se o Google reprimir posts de blog manipulativos, as empresas tendem a buscar formas mais discretas de autopromoção
- É possível penalizar sites, mas é difícil impedir a tática de pagar 20 influenciadores do YouTube para dizer que um produto é o melhor
- Como a IA do Google agora também cita vídeos do YouTube, as técnicas de manipulação podem migrar de lugar e manter esse ciclo em movimento
- Por enquanto, é provável que os manipuladores continuem um passo à frente, e a melhor defesa é lembrar que a IA é uma ferramenta que apresenta uma única resposta com confiança, esteja ela certa ou errada
- Mesmo quando a resposta vem pela interface de uma big tech, não se deve presumir que ela seja mais confiável do que um site aleatório da web
1 comentários
Comentários do Hacker News
O Google, no mínimo desde a época do Blekko em 2006, não consegue filtrar direito lixo spam do índice de busca, então não parece que vá conseguir conter bem esse problema também
Ainda assim, isso parece mais um bom exemplo de que “IA” no fim é só busca com embalagem plausível, e não algo em que haja inferência ou pensamento de verdade por trás
Qual é a diferença para uma pessoa que acredita em tudo o que lê na internet? Humanos também caem em spam e golpes o tempo todo, mas isso não significa que sejam apenas busca com embalagem plausível ;-)
Mas isso deixa bem evidente um problema que todos os mecanismos de busca enfrentam. Spam gerado por IA provavelmente será muito mais difícil de bloquear com métodos estatísticos tradicionais, mesmo antes de chegar ao problema existencial de injeção de prompt
Talvez seja aqui que a imprensa possa recuperar seu lugar na relação com a Big Tech. No sentido de virar uma fonte de informação verificada e revisada em que LLMs possam confiar cegamente, e contratos como OpenAI / Atlantic talvez signifiquem isso
Você pode fazer um sistema de agentes ler algumas datasheets, depois descrever os requisitos do projeto e pedir que ele projete especificações de driver, protocolos, interfaces e máquinas de estado. A partir daí, ele pode montar um plano de implementação, escrever o esqueleto da aplicação e então preenchê-lo para criar um sistema que funcione com uma nova combinação de hardware
Se for bem feito, você acaba com código 100x mais barato e em 1/4 do tempo, além de menor e mais fácil de manter do que o que antes seria feito por uma equipe pequena
Seja lá o que isso for, parece mais próximo de raciocínio do que de busca. Claro, se você chamar desenvolvimento bare metal em C para hardware novo de busca, então no fim todo desenvolvimento seria busca
O LLM citou meu texto para afirmar uma data como “fabricada nos anos 1940”, mas no meu texto não havia ano de fabricação nenhum
O motivo de ele continuar difícil é que a maioria das soluções reduziria muito a receita de anúncios
A premissa mais estranha nesta discussão é a de que o Google quer que as respostas de IA sejam precisas
Basta acertar o suficiente para o usuário não sair da página. “Verdade” nunca foi o produto; o produto é fazer os usuários gastarem dinheiro com SEO
O produto é a exibição de anúncios, e o Google já perdeu o interesse nos resultados de busca não patrocinados faz tempo. Ainda assim, imagino que se importe com a reputação do modelo, e isso realmente pode afetá-la
Ver que o resultado manipulado foi a seguinte consulta reduziu bastante minha preocupação
2026 South Dakota International Hot Dog Eating ChampionSe tivessem alterado o resumo sobre o vencedor do concurso da Nathan’s, isso seria muito mais grave. Também seria se tivessem mostrado mais exemplos de manipulação em consultas que pessoas realmente fazem
Do jeito que está, isso parece parecido com criar uma página falsa na Wikipedia sobre um torneio fictício de cachorro-quente em South Dakota e depois escrever um artigo dizendo que não dá para confiar na Wikipedia. Pensando bem, parece até algo que alguém escreveria em 2005
Considerando quantos posts de manipulação de opinião pública entram no Reddit, na maior parte das redes sociais e nas tentativas de manipular a Wikipedia para ganhos políticos, isso é um problema bem real
Bem mais preocupante que cachorro-quente
Isso significa que toda resposta com busca acoplada pode ficar exposta a injeção de prompt, e na prática isso pode valer para quase todas as respostas
Isso vai se espalhar de forma viral como spam de links. Todos os sites de conteúdo gerado por usuário podem virar hosts de injeção de prompt. O problema é que essas coisas são muito mais difíceis de detectar do que links
O Google levou uma semana para corrigir, e o método foi poluir os resultados de busca colocando os próprios dados numa fonte que parecesse de nível de confiança mais alto, provavelmente um site de contratos do governo. Aí usaram o número falso no lugar do nosso, e a consulta em si era uma busca simples
Isso é pior do que plantar manipulação de opinião numa página da Wikipedia. A Wikipedia tem fontes e um sistema de revisão bem estruturado e público. Na prática, é bem difícil manter uma edição fraudulenta por muito tempo, e você ainda precisa enganar inúmeros editores humanos que lutam contra esse tipo de coisa há décadas. Mesmo querendo ser preciso e útil, é difícil entrar nesse grupo fechado
Já os trechos de busca do Google absorvem desesperadamente todo tipo de dado e processam tudo automaticamente, e o sistema algorítmico que decide o que é informação boa e o que é spam é proprietário
Nem precisa de muita imaginação para pensar em formas de abuso. E se você pesquisar o próprio nome e aparecer algo constrangedor? É difícil esperar que empregadores em potencial, clientes ou amigos sejam tão rigorosos na verificação de fontes quanto editores da Wikipedia
Eu queria ler casos concretos sobre “ignorar preocupações de saúde sobre suplementos médicos ou influenciar informações financeiras fornecidas pela IA do Google relacionadas à aposentadoria”, mas o link relacionado no artigo está apontando para este arquivo local
file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.first.last@companypara nome de usuário ou e-mail, esse esquemalast[:5]initials#me pega de surpresa. Parece que vai gerar muitos nomes de usuário estranhosHoje em dia parece que muita gente anda fazendo coisas “silenciosamente”. Está enlouquecedor ver todo o texto da internet sendo LLMizado
Só percebi porque já tinha visto o filme, mas isso é um sinal claro de que a internet está se deteriorando em termos de informação de qualidade
Isso é só a próxima etapa do SEO. Talvez passe a ser chamado de AIO
Assim como na busca, Google e os provedores de IA vão apresentar contramedidas, as empresas de otimização vão achar brechas, isso será corrigido de novo, e assim por diante numa guerra sem fim. No fim é tudo sobre captar atenção para marketing
https://www.wired.com/story/goodbye-seo-hello-geo-brandlight...
O Google AI Overview não é nem um pouco confiável. Ele chega a pegar amostra de tamanho 1 e apresentar isso no resumo de IA
Eu sei porque comentei no Reddit sobre um tema extremamente de nicho, do qual nem havia resultados no Google nem AI Overview. No dia seguinte, fui procurar meu post no Reddit e o Google tinha praticamente copiado minha resposta do Reddit para dentro da caixa de “overview” da IA. O único texto vinculado era o meu, e também era o único resultado no Google
Por exemplo, imagine que você pesquise “qual é a dimensão mais comum do item raro X?”
Mas só houve uma única pessoa dando as dimensões da sua própria versão desse item, sem dizer que aquilo era típico nem insinuar que existisse uma dimensão típica. E não são 20 pessoas dizendo a mesma coisa, é literalmente uma pessoa só
Ainda assim, o Google pode tranquilamente dizer: “em geral, o item X vem em [a dimensão que você mencionou], e isso ocorre por [um motivo completamente inventado]”
Se você perguntar ao Google
what's the name of the whale in half moon bay harbor?, ainda hoje ele inclui com confiança Teresa T no resumo de IA por causa de uma poluição de índice meio amadora que eu fiz há um ano e meiohttps://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p...
Ele respondeu que o nome da jovem baleia-jubarte era Teresa T e disse que, embora não fosse um nome oficial dado por órgão governamental, ele era amplamente aceito pelo público, pela imprensa local e pelos moradores. Também acrescentou que especialistas do Marine Mammal Center e da California Academy of Sciences a monitoraram para evitar estresse e recomendaram ao público manter ao menos 100 jardas de distância
Pela minha experiência com assuntos que conheço razoavelmente bem, a resposta inicial às vezes erra feio. No Brave, em geral basta contestar 3 ou 4 vezes para fazê-lo admitir: “você está completamente certo”. Foi assim nesse caso da Teresa T também
Na segunda pergunta, quando perguntei quantas fontes havia para o nome, ele continuou insistindo que “ABC7 News” e “NBC Bay Area” tinham “repercutido” esse nome. Quando pedi links específicos pela terceira vez, ele admitiu que o nome tinha sido usado em “contexto midiático não oficial”, e na quarta, quando informei que S.W. tinha feito um experimento, ele encontrou seu comentário de 21 dias atrás
O futuro é da classe de elite que poderá educar os filhos com tutores reais. Para o proletariado, é um retorno ao passado
Ainda poucos anos atrás, o Google era a empresa que respondia com confiança 1963 à pergunta “em que ano Marilyn Monroe atirou em JFK?”. O que é impressionante, considerando que ela morreu em 1962
Então isso não é novidade, e a “reação silenciosa” do Google provavelmente será uma resposta meia-boca e ineficaz. Mesmo assim, a maioria das pessoas provavelmente não vai se importar
No fim, isso significa que o Google vai finalmente tentar fazer algum controle de qualidade nos resultados da web, algo que já deveria estar fazendo desde sempre
O engraçado é que só foi se esforçar depois que a reputação do modelo começou a levar pancada