- O Google AI Overview exibiu a informação incorreta de que 'Dave Barry' havia morrido
- Na realidade, Dave Barry está vivo, mas a IA continuou refletindo a informação errada repetidamente
- O usuário enviou feedback várias vezes, mas não houve uma solução satisfatória no processo de conversa com a IA e correção do problema
- A IA confunde informações sobre pessoas reais, misturando-as com outras ou repetindo erros diversas vezes
- Este caso mostra que a IA ainda tem limitações em tarefas baseadas em fatos
Introdução
- Dave Barry descobriu a própria morte no 'Google'
- Ao pesquisar seu nome ("Dave Barry") no Google, apareceu um recurso de resumo chamado Google AI Overview
- Esse recurso usa inteligência artificial para resumir os resultados de busca e recentemente tem atraído o interesse de muitos usuários
Confirmação da informação incorreta sobre a morte
- No Google AI Overview, havia uma lista de perguntas chamada "People also ask" junto com as informações básicas de Dave Barry
- Entre essas perguntas, havia conteúdo dizendo que Dave Barry havia morrido, o que na verdade não era fato
- Dave Barry tinha certeza de que estava vivo, inclusive com base em diagnósticos de vários profissionais de saúde
Como o Google AI tratou o feedback
- Dave Barry enviou feedback sobre a informação incorreta no Google AI Overview
- Considerando que o Google opera com um sistema automatizado, ele não esperava que a correção acontecesse rapidamente
- No entanto, depois do envio do feedback, a parte da pergunta foi modificada, mas a explicação correta desapareceu e foi substituída por informação ainda mais imprecisa (sobre outro Dave Barry)
Problemas na comunicação com a IA
- Dave Barry iniciou um novo feedback para apontar novamente que a IA estava entendendo sua situação de forma errada
- Nesse processo, a conversa com o chatbot de IA não funcionou adequadamente, e a IA não conseguiu compreender bem o sentido do problema
- Apesar das explicações repetidas, a IA não reconheceu a falha, e a conversa avançou como se ele estivesse tentando se comunicar com uma máquina
Erros repetidos e solução temporária
- Depois do envio de feedback adicional, o conteúdo do Overview foi alterado novamente, e a informação sobre a morte desapareceu
- No entanto, ainda havia erros em outras partes (informações sobre publicação de livros, histórico de atuação como colunista etc.)
- Mesmo depois disso, o Overview voltou a indicar sua morte, mostrando que a precisão das informações mudava repetidamente de forma instável
- Na última verificação, apareceu uma explicação dizendo que havia "confusão", e Dave Barry voltou a ser mostrado como vivo
Conclusão e lições
- Essa experiência mostrou que a IA é uma ferramenta muito poderosa, mas é difícil confiar nela em tarefas que exigem verificação precisa de fatos
- Por enquanto, a IA é mais adequada para trabalhos de baixa confiabilidade exigida (por exemplo, escrever cartas de recomendação ou rascunhos de políticas) e inadequada para áreas que exigem alta precisão (por exemplo, operação de aeronaves)
- Em última análise, isso sugere que é preciso cautela no uso futuro da IA, junto com o reconhecimento de suas limitações
Enquete
- Foi apresentada aos leitores a pergunta: "Você acha que a IA será, no futuro, uma presença benéfica para a humanidade?"
- O texto termina com uma piada leve
1 comentários
Opiniões do Hacker News
Um lugar popular aqui da minha cidade está resumido no Google Maps da seguinte forma
Diz que é um bar animado onde dá para aproveitar bebidas e sanduíches po' boy, com jukebox, mesa de sinuca e dardos eletrônicos, mas na realidade não há po' boy, nem jukebox (a playlist é ótima), nem mesa de sinuca, nem dardos eletrônicos. As bebidas basicamente se resumem a cerveja e alguns produtos enlatados; não há coquetéis nem drinques mistos
Há um mês, alguém foi até lá querendo jogar sinuca ou dardos, se decepcionou porque não tinha nada disso e deixou uma avaliação crítica de 1 estrela
Claramente o dono do local denunciou isso, eu também denunciei, e imagino que outros visitantes também tenham denunciado
Mesmo assim, já se passou um mês e a informação errada continua lá
A solução mais simples é realmente passar a vender po' boy e instalar jukebox/sinuca/dardos eletrônicos
Eu realmente gostaria que o Google tivesse uma opção global para desativar qualquer coisa com cara óbvia de “feito por IA”
Acho que talvez eu esteja pedindo demais
Por causa dessas informações imprecisas, as pessoas de fato tomam decisões com base nelas (como visitar o estabelecimento) e acabam até deixando avaliações erradas
Fico me perguntando se, nesse tipo de caso, seria possível entrar com uma ação por perdas e danos
Ou se seria melhor simplesmente remover a informação do Google
Hoje em dia, sempre que tento ajudar pessoas online em fóruns de carros, grupos de Facebook etc., alguém aparece mostrando um “print que viu no Google”, e claramente é um resumo de IA
Por exemplo, aparece uma explicação detalhada dizendo que existe a funcionalidade X, mas essa funcionalidade simplesmente nunca existiu
Isso acontece o tempo todo
É um problema enorme, especialmente em comunidades online sobre carros
Acho que isso não é só um problema de resumo por IA, mas um problema estrutural do Google
O Google frequentemente mostra informações imprecisas, e normalmente quase não existe jeito de corrigir isso
Formulários de feedback e afins são ignorados na maioria das vezes
No Google Maps, tive que lutar durante anos para corrigir informações erradas por causa exatamente desse mesmo problema, e a maioria das pessoas acredita que o Google Maps é a própria verdade
Nem dá para ter certeza se alguma informação realmente mudou por causa do meu feedback
O Google despeja informação como se estivesse jogando tudo por uma mangueira de incêndio (feed)
O Google é grande demais para se importar muito com esse tipo de inconsistência e, pior, parece não ligar porque isso não afeta seu modelo de negócio
Acho que isso é, sim, um problema real dos resumos por IA
No começo, eles simplesmente colocavam no topo o resultado de busca mais relevante para a consulta do usuário, e o usuário clicava para verificar por conta própria se a informação estava certa
Agora o resumo por IA sempre aparece no topo, e o LLM é um modelo muito rápido, porém burro, barato o suficiente para ser executado em cada página da web
Isso é claramente uma decisão de produto, e uma decisão gravemente errada
Por exemplo, se você pesquisar por "Suicide Squad", aparece algo assim
Neste caso, a informação imprecisa apareceu porque o resumo por IA misturou informações de duas pessoas diferentes
Numa busca tradicional, cada página trataria das informações de apenas uma pessoa
Então isso é justamente um problema que surge no resumo por IA
O Google, em particular, não tem muito incentivo para priorizar a precisão no nível de cada usuário individual
Por causa do volume gigantesco de conteúdo, também é uma estrutura em que é fácil ignorar tudo sob a desculpa da “escala”
Existe, sim, uma solução quando há informação errada
É colocar a história na página principal do Hacker News (HN)
Antigamente, meu maior motivo para reclamar do Google era algo no nível de a documentação do Java 1.4 (ao buscar por nome de classe) aparecer antes da documentação da versão 6
Fico me perguntando se esse caso de “a IA escreveu que Dave Barry morreu em 2016” vai mudar os resumos no futuro, à medida que os textos dele forem sendo indexados
Talvez passe a aparecer um resumo de IA como “Dave Barry morreu em 2016, mas continua negando esse fato”
O resumo de IA que recebi agora foi este
Dá até para imaginar a IA escrevendo algo como “Dave Barry era conhecido por ter morrido em 2016, mas houve controvérsia quando se descobriu que ele estava vivo”
Acho que esse tipo de erro também é, em parte, inevitável por causa do problema da unicidade dos nomes das pessoas
Talvez uma saída fosse sempre mostrar uma pergunta básica do tipo “quais são as outras pessoas com o mesmo nome?” quando alguém digita um nome
Isso não resolveria o problema de misturar informações de várias pessoas, mas acho que a maioria dos casos ocorre porque o nome coincide com o de alguma figura famosa
Parece que o Google usa knowledge graph até certo ponto, mas fico curioso sobre o quanto o LLM realmente consulta esse grafo
Provavelmente ele consulta tanto o grafo quanto os resultados normais da busca do Google, e o LLM (talvez algo simples como Gemini Flash Lite) acaba não distinguindo bem a celebridade do knowledge graph das informações vindas dos resultados de busca, e mistura tudo
Isso acontece especialmente quando há homônimos com diferentes níveis de notoriedade em várias áreas
Eu mesmo, ao criar um app pessoal de knowledge graph, percebi que usar o nome (sobrenome, nome) como entity ID pode causar problemas algum dia
No meu caso, como é para organizar informações pessoais, talvez tudo bem, mas já vejo problemas na análise de e-mails, onde meus vários apelidos não são reconhecidos corretamente como a mesma pessoa
No fim, esse tipo de “confusão” vem do fato de a máquina não saber que nomes humanos não são únicos (singletons)
Como parte de um movimento social, pretendo dar a todos os meus filhos o nome Google (incluindo os que já têm nome)
Dave Barry é excelente
Esse é um problema clássico que já acontecia com frequência no Google antes mesmo da IA
Sou pessimista quanto a isso mudar, mas ainda assim não quero perder a esperança
E fósseis de trilobitas são muito fofos
Eu até tenho um fóssil de verdade em cima da mesa, e um amigo colocou óculos nele
Isso porque, na visão dele, eu já sou um “tio dinossauro”, mas os trilobitas são ainda mais antigos
https://www.trilobites.info/
Recentemente vi um caso em que a banda Dutch Interior foi alvo de uma difamação completamente infundada feita pela Meta AI
A IA inventou que a banda estaria ligada a supremacistas brancos e extremistas de direita
https://youtube.com/shorts/eT96FbU_a9E?si=johS04spdVBYqyg3
https://www.politico.eu/article/dutch-scandal-serves-as-a-warning-for-europe-over-risks-of-using-algorithms/
Em 2019, a autoridade tributária holandesa criou perfis de risco com uma IA autoaprendente para detectar fraudes em benefícios de creche, e isso acabou provocando a destruição de inúmeras famílias, lares adotivos, falências e até suicídios
Em 2021, a autoridade holandesa de proteção de dados chegou a aplicar uma multa de 2,75 milhões de euros à autoridade tributária
O governo multando a si mesmo, que movimento realmente “incrível”
Essa situação absurda é criativa demais
É parecida com o fenômeno daquele texto “Eu sou o escritor de ficção científica Greg Egan, não há fotos minhas na internet” circulando de forma inútil pela internet
https://www.gregegan.net/images/GregEgan.htm
Acho que alguns resumos sobre Dave Barry não estavam realmente errados, porque existe outro Dave Barry que de fato morreu (um homônimo que faleceu naquele período)
Fico me perguntando por que este Dave Barry deveria ter mais representatividade quando alguém responde à pergunta “o que aconteceu com ele?”
Na prática, nada aconteceu com ele, mas aconteceu com o homônimo dele (a morte)
Se essa informação estivesse misturada entre informações ou links sobre o Dave Batty de Boston, o contexto ficaria claramente definido
Então, neste contexto, a informação estava errada
Só de ver frases como “Dave Barry, humorista e vencedor do Pulitzer, morreu em 20 de novembro do ano passado...” ou “Dave Barry (Bostonian)... morreu em 20 de novembro...”, já fica claro de quem se está falando
Mesmo quando o contexto sai da frase e vai para fora dela (embedding context), a identidade do sujeito continua tendo um papel importante nesse tipo de formulação
De fato, quando você pesquisa o nome no Google, o resumo aparece no topo apontando para Dave Barry (o escritor)
Só para constar, quando pesquisei, dizia que Dave Barry estava vivo, mas a base usada era um artigo da Wikipédia sobre Dave Berry (o músico)
Essa versão também pode ficar alternando na exibição com outros resumos de IA
O ideal seria desambiguar claramente por pessoa, como a Wikipédia faz
Vai ver o outro Dave Barry também está vivo, afinal
Na seção “O que aconteceu com Dave Barry?”, havia informação sobre Dave Barry, o ativista, dentro de uma subseção do Dave Barry comediante
Para uma pessoa comum, isso obviamente seria entendido no contexto do comediante
Então este Dave Barry (o humorista) tem, sim, base para afirmar que a pergunta estava sendo feita sobre ele
Seria como se, no meio da página da Wikipédia de Dave Barry (comediante), sem contexto nenhum, aparecesse a notícia da morte de outro Dave Barry