1 pontos por GN⁺ 3 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • Respostas de busca por IA, como AI Overviews e ChatGPT, podem ser enviesadas em temas sensíveis como saúde e finanças até por uma única página da web ou postagem
  • Em um experimento da BBC, um único texto em um site pessoal fez com que ChatGPT e Google respondessem que o autor era um campeão mundial de comer cachorro-quente
  • Quando a IA reúne resultados da web e entrega uma única resposta, os usuários tendem mais a aceitá-la como se fosse a resposta certa do que numa busca tradicional, em que comparariam vários links
  • O Google deixou claro que manipular respostas de IA viola sua política contra spam, e sites infratores podem ser removidos dos resultados de busca ou rebaixados no ranking
  • Como quem manipula pode migrar de blogs para influenciadores no YouTube e outros meios para escapar da fiscalização, é preciso não confiar cegamente nas respostas de IA

Problema da manipulação de respostas de busca por IA

  • AI Overviews no topo do Google Search, além de ChatGPT e Gemini, podem ser manipulados para fornecer respostas enviesadas até em temas importantes como saúde e finanças pessoais
  • Em uma investigação da BBC, foi possível fazer com que ChatGPT e Google respondessem que o autor era “campeão mundial de comer cachorro-quente” usando apenas um único texto publicado em um site pessoal
  • Há indícios de que o mesmo método também tenha sido usado para minimizar preocupações de saúde sobre suplementos médicos ou influenciar informações financeiras relacionadas à aposentadoria
  • A consultora de SEO e busca por IA Lily Ray avalia que, em um ambiente em que a IA entrega “uma única resposta correta”, os usuários tendem a acreditar na resposta como está em vez de comparar vários links, como fariam na busca tradicional
  • O Google afirmou que já aplica às funções de busca com IA generativa suas políticas anti-spam e mecanismos de proteção existentes, e que vem reforçando o combate a spam contra novas táticas desde antes da chegada da IA

Como a manipulação funciona

  • Respostas de chatbots em geral se baseiam em dados embutidos no modelo, mas o risco de manipulação cresce quando ferramentas como ChatGPT, Claude e os produtos de IA do Google pesquisam na internet para encontrar respostas
  • Quando uma ferramenta de IA obtém informações de uma única página da web ou postagem em rede social, basta uma postagem falsa bem elaborada para contaminar a resposta
  • Publicar apenas um post de blog sofisticado online já pode mudar o conteúdo que a IA transmite ao público
  • Esse tipo de manipulação rapidamente passou a ser visto como oportunidade de ganhar dinheiro, e informações imprecisas ou enviesadas podem afetar votos, escolha de prestadores de serviço, aconselhamento médico e decisões legais
  • Harpreet Chatha destaca não apenas o impacto econômico, mas também o risco de uma condição piorar por orientação médica errada ou de alguém agir de forma incompatível com as leis de seu país ou região

Mudança de política e resposta do Google

  • Mais de 1 bilhão de pessoas no mundo usam chatbots de IA com regularidade, e 2,5 bilhões veem os AI Overviews do Google todos os meses, então o impacto de conseguir perturbar essas ferramentas é enorme
  • Na semana passada, o Google atualizou sua política contra spam para confirmar oficialmente que tentativas de manipular respostas de IA violam as regras da empresa
  • Empresas ou sites que violarem as regras podem ser removidos dos resultados de busca do Google ou rebaixados no ranking
  • O Google disse que essa mudança não representa uma alteração de abordagem, mas sim um “esclarecimento”, e já havia explicado em 2025 seus esforços anti-spam relacionados a AI Overview e AI Mode
  • Ainda assim, o experimento do cachorro-quente teve sucesso quase um ano depois, e Lily Ray também realizou nesta semana um experimento semelhante que levou o Google a responder que um especialista em SEO era alguém habilidoso em construir castelos de areia

Mudanças observadas e limitações

  • Segundo Ray e Chatha, nos últimos meses surgiram mudanças que sugerem que Google e outras empresas estão testando soluções
  • Há casos em que, se Google e ChatGPT suspeitam da autopromoção de uma determinada empresa, parecem excluí-la discretamente da resposta de IA
  • Por exemplo, se um texto afirma que seu autor é o melhor competidor de comer cachorro-quente, a IA pode citar o texto, mas excluir o nome da lista de candidatos
  • Também foram observados casos em que Google e outras ferramentas de IA adicionam mais rótulos de incerteza às respostas para indicar que o chatbot não está confiante
  • ChatGPT e Claude, da Anthropic, passaram a responder explicitamente em algumas consultas que estão tentando filtrar spam, e a Anthropic é a empresa que criou o Claude
  • Ray diz ter visto o Google também acrescentar mais ressalvas em perguntas ligadas a decisões de compra específicas e recomendar que se verifiquem avaliações de terceiros
  • OpenAI e Anthropic se recusaram a comentar, e um porta-voz do Google não respondeu a perguntas sobre essas mudanças

A repetida corrida entre manipuladores e plataformas

  • Chatha afirma que essas mudanças por si só provavelmente não serão suficientes e compara a resposta do Google a um jogo de whac-a-mole
  • Se o Google reprimir posts de blog manipulativos, as empresas tendem a buscar formas mais discretas de autopromoção
  • É possível penalizar sites, mas é difícil impedir a tática de pagar 20 influenciadores do YouTube para dizer que um produto é o melhor
  • Como a IA do Google agora também cita vídeos do YouTube, as técnicas de manipulação podem migrar de lugar e manter esse ciclo em movimento
  • Por enquanto, é provável que os manipuladores continuem um passo à frente, e a melhor defesa é lembrar que a IA é uma ferramenta que apresenta uma única resposta com confiança, esteja ela certa ou errada
  • Mesmo quando a resposta vem pela interface de uma big tech, não se deve presumir que ela seja mais confiável do que um site aleatório da web

1 comentários

 
GN⁺ 3 시간 전
Comentários do Hacker News
  • O Google, no mínimo desde a época do Blekko em 2006, não consegue filtrar direito lixo spam do índice de busca, então não parece que vá conseguir conter bem esse problema também
    Ainda assim, isso parece mais um bom exemplo de que “IA” no fim é só busca com embalagem plausível, e não algo em que haja inferência ou pensamento de verdade por trás

    • Não acho que essa conclusão decorra daí. Sem termo melhor, isso parece mais um caso de LLM ser “facilmente enganado”
      Qual é a diferença para uma pessoa que acredita em tudo o que lê na internet? Humanos também caem em spam e golpes o tempo todo, mas isso não significa que sejam apenas busca com embalagem plausível ;-)
      Mas isso deixa bem evidente um problema que todos os mecanismos de busca enfrentam. Spam gerado por IA provavelmente será muito mais difícil de bloquear com métodos estatísticos tradicionais, mesmo antes de chegar ao problema existencial de injeção de prompt
      Talvez seja aqui que a imprensa possa recuperar seu lugar na relação com a Big Tech. No sentido de virar uma fonte de informação verificada e revisada em que LLMs possam confiar cegamente, e contratos como OpenAI / Atlantic talvez signifiquem isso
    • Acho difícil explicar geração de código novo como busca com embalagem plausível
      Você pode fazer um sistema de agentes ler algumas datasheets, depois descrever os requisitos do projeto e pedir que ele projete especificações de driver, protocolos, interfaces e máquinas de estado. A partir daí, ele pode montar um plano de implementação, escrever o esqueleto da aplicação e então preenchê-lo para criar um sistema que funcione com uma nova combinação de hardware
      Se for bem feito, você acaba com código 100x mais barato e em 1/4 do tempo, além de menor e mais fácil de manter do que o que antes seria feito por uma equipe pequena
      Seja lá o que isso for, parece mais próximo de raciocínio do que de busca. Claro, se você chamar desenvolvimento bare metal em C para hardware novo de busca, então no fim todo desenvolvimento seria busca
    • Já postei vídeos e textos no Reddit sobre lentes vintage, e tentei descobrir quão antiga era uma delas
      O LLM citou meu texto para afirmar uma data como “fabricada nos anos 1940”, mas no meu texto não havia ano de fabricação nenhum
    • O Google teve capacidade de sobra para resolver esse problema, e na verdade nem seria tão difícil assim
      O motivo de ele continuar difícil é que a maioria das soluções reduziria muito a receita de anúncios
    • O AI Overview do Google parece ser um caso de usar RAG para puxar trechos da busca e um LLM muito rápido para resumir. Eu não chamaria isso de busca com embalagem plausível
  • A premissa mais estranha nesta discussão é a de que o Google quer que as respostas de IA sejam precisas
    Basta acertar o suficiente para o usuário não sair da página. “Verdade” nunca foi o produto; o produto é fazer os usuários gastarem dinheiro com SEO

    • Isso não parece muito correto. A maior parte de SEO é feita por terceiros
      O produto é a exibição de anúncios, e o Google já perdeu o interesse nos resultados de busca não patrocinados faz tempo. Ainda assim, imagino que se importe com a reputação do modelo, e isso realmente pode afetá-la
  • Ver que o resultado manipulado foi a seguinte consulta reduziu bastante minha preocupação
    2026 South Dakota International Hot Dog Eating Champion
    Se tivessem alterado o resumo sobre o vencedor do concurso da Nathan’s, isso seria muito mais grave. Também seria se tivessem mostrado mais exemplos de manipulação em consultas que pessoas realmente fazem
    Do jeito que está, isso parece parecido com criar uma página falsa na Wikipedia sobre um torneio fictício de cachorro-quente em South Dakota e depois escrever um artigo dizendo que não dá para confiar na Wikipedia. Pensando bem, parece até algo que alguém escreveria em 2005

    • Sim. Isso só mostra o que uma pessoa consegue fazer
      Considerando quantos posts de manipulação de opinião pública entram no Reddit, na maior parte das redes sociais e nas tentativas de manipular a Wikipedia para ganhos políticos, isso é um problema bem real
    • O artigo também dizia o seguinte: “Mas a investigação descobriu que a mesma técnica também estava sendo usada para ignorar preocupações de saúde sobre suplementos médicos e para influenciar informações financeiras fornecidas pela IA do Google relacionadas à aposentadoria”
      Bem mais preocupante que cachorro-quente
    • Na verdade, isso me preocupou imediatamente mais. Recentemente o Gemini passou a mostrar o spinner de busca em toda interação
      Isso significa que toda resposta com busca acoplada pode ficar exposta a injeção de prompt, e na prática isso pode valer para quase todas as respostas
      Isso vai se espalhar de forma viral como spam de links. Todos os sites de conteúdo gerado por usuário podem virar hosts de injeção de prompt. O problema é que essas coisas são muito mais difíceis de detectar do que links
    • Já vi alguém conseguir fazer o AI Overview incluir um número falso de atendimento ao cliente golpista
      O Google levou uma semana para corrigir, e o método foi poluir os resultados de busca colocando os próprios dados numa fonte que parecesse de nível de confiança mais alto, provavelmente um site de contratos do governo. Aí usaram o número falso no lugar do nosso, e a consulta em si era uma busca simples
    • “Em 20 minutos, enganei o ChatGPT e o Google para dizerem ao público que eu era campeão mundial de comer cachorro-quente. A piada foi idiota, mas o problema é sério”
      Isso é pior do que plantar manipulação de opinião numa página da Wikipedia. A Wikipedia tem fontes e um sistema de revisão bem estruturado e público. Na prática, é bem difícil manter uma edição fraudulenta por muito tempo, e você ainda precisa enganar inúmeros editores humanos que lutam contra esse tipo de coisa há décadas. Mesmo querendo ser preciso e útil, é difícil entrar nesse grupo fechado
      Já os trechos de busca do Google absorvem desesperadamente todo tipo de dado e processam tudo automaticamente, e o sistema algorítmico que decide o que é informação boa e o que é spam é proprietário
      Nem precisa de muita imaginação para pensar em formas de abuso. E se você pesquisar o próprio nome e aparecer algo constrangedor? É difícil esperar que empregadores em potencial, clientes ou amigos sejam tão rigorosos na verificação de fontes quanto editores da Wikipedia
  • Eu queria ler casos concretos sobre “ignorar preocupações de saúde sobre suplementos médicos ou influenciar informações financeiras fornecidas pela IA do Google relacionadas à aposentadoria”, mas o link relacionado no artigo está apontando para este arquivo local
    file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.

    • Houve alguns erros assim recentemente em artigos da BBC, e o pior é que eles não colocam mais a observação de histórico de correções do artigo publicado depois de corrigir
    • Como sempre usei first.last@company para nome de usuário ou e-mail, esse esquema last[:5]initials# me pega de surpresa. Parece que vai gerar muitos nomes de usuário estranhos
  • Hoje em dia parece que muita gente anda fazendo coisas “silenciosamente”. Está enlouquecedor ver todo o texto da internet sendo LLMizado

    • Também me irrita, mas redatores e editores de manchete já eram viciados em “silenciosamente” muito antes de LLM. O jornalismo online já estava cheio desse clichê fazia tempo
    • Eu odeio isso mesmo. Ontem li num subreddit de história um texto histórico feito por IA, e parecia que todas as fontes eram filmes de Hollywood inventados
      Só percebi porque já tinha visto o filme, mas isso é um sinal claro de que a internet está se deteriorando em termos de informação de qualidade
    • “Silenciosamente” não é uma expressão nova ao estilo LLM
    • A graça desse clichê é justamente dizer em voz alta algo que supostamente deveria estar sendo feito em silêncio
  • Isso é só a próxima etapa do SEO. Talvez passe a ser chamado de AIO
    Assim como na busca, Google e os provedores de IA vão apresentar contramedidas, as empresas de otimização vão achar brechas, isso será corrigido de novo, e assim por diante numa guerra sem fim. No fim é tudo sobre captar atenção para marketing

    • No mercado, em geral chamam isso de GEO: Generative Engine Optimization, e às vezes também de Answer Engine Optimization, e já tem gente ganhando muito dinheiro vendendo esse serviço
      https://www.wired.com/story/goodbye-seo-hello-geo-brandlight...
    • Engineered Inference Ersatz Intelligence Optimization, ou EIEIO
    • Não é a próxima etapa, já é a etapa atual
  • O Google AI Overview não é nem um pouco confiável. Ele chega a pegar amostra de tamanho 1 e apresentar isso no resumo de IA
    Eu sei porque comentei no Reddit sobre um tema extremamente de nicho, do qual nem havia resultados no Google nem AI Overview. No dia seguinte, fui procurar meu post no Reddit e o Google tinha praticamente copiado minha resposta do Reddit para dentro da caixa de “overview” da IA. O único texto vinculado era o meu, e também era o único resultado no Google

    • E além disso ele ainda envolve esse conteúdo com um contexto que não existe no post original, adaptando à forma como o usuário fez a pergunta. Aí simplesmente fica errado
      Por exemplo, imagine que você pesquise “qual é a dimensão mais comum do item raro X?”
      Mas só houve uma única pessoa dando as dimensões da sua própria versão desse item, sem dizer que aquilo era típico nem insinuar que existisse uma dimensão típica. E não são 20 pessoas dizendo a mesma coisa, é literalmente uma pessoa só
      Ainda assim, o Google pode tranquilamente dizer: “em geral, o item X vem em [a dimensão que você mencionou], e isso ocorre por [um motivo completamente inventado]”
  • Se você perguntar ao Google what's the name of the whale in half moon bay harbor?, ainda hoje ele inclui com confiança Teresa T no resumo de IA por causa de uma poluição de índice meio amadora que eu fiz há um ano e meio
    https://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p...

    • Acabei de testar no Brave Search
      Ele respondeu que o nome da jovem baleia-jubarte era Teresa T e disse que, embora não fosse um nome oficial dado por órgão governamental, ele era amplamente aceito pelo público, pela imprensa local e pelos moradores. Também acrescentou que especialistas do Marine Mammal Center e da California Academy of Sciences a monitoraram para evitar estresse e recomendaram ao público manter ao menos 100 jardas de distância
      Pela minha experiência com assuntos que conheço razoavelmente bem, a resposta inicial às vezes erra feio. No Brave, em geral basta contestar 3 ou 4 vezes para fazê-lo admitir: “você está completamente certo”. Foi assim nesse caso da Teresa T também
      Na segunda pergunta, quando perguntei quantas fontes havia para o nome, ele continuou insistindo que “ABC7 News” e “NBC Bay Area” tinham “repercutido” esse nome. Quando pedi links específicos pela terceira vez, ele admitiu que o nome tinha sido usado em “contexto midiático não oficial”, e na quarta, quando informei que S.W. tinha feito um experimento, ele encontrou seu comentário de 21 dias atrás
      O futuro é da classe de elite que poderá educar os filhos com tutores reais. Para o proletariado, é um retorno ao passado
    • Você não tem medo de o Google mandar alguma notificação ameaçadora por tentar manipular as respostas de IA?
  • Ainda poucos anos atrás, o Google era a empresa que respondia com confiança 1963 à pergunta “em que ano Marilyn Monroe atirou em JFK?”. O que é impressionante, considerando que ela morreu em 1962
    Então isso não é novidade, e a “reação silenciosa” do Google provavelmente será uma resposta meia-boca e ineficaz. Mesmo assim, a maioria das pessoas provavelmente não vai se importar

  • No fim, isso significa que o Google vai finalmente tentar fazer algum controle de qualidade nos resultados da web, algo que já deveria estar fazendo desde sempre
    O engraçado é que só foi se esforçar depois que a reputação do modelo começou a levar pancada