EY Canada publicou um relatório de cibersegurança, e a maioria das citações era alucinação
(gptzero.me)- O relatório de 44 páginas sobre fraude em programas de fidelidade da EY Canada revelou-se um documento com citações falsas, atribuição incorreta de fontes, estatísticas inventadas e texto escrito por IA
- A maioria das URLs na tabela de referências estava quebrada ou era falsa, mais da metade dos títulos não correspondia às fontes reais, e o AI Scan marcou 72% do texto como gerado por IA
- Muitas fontes atribuídas a BleepingComputer, Wired, Gartner, McKinsey, Forbes, Cisco Talos e TechCrunch foram confirmadas como erro 404, páginas de tag ou documentos inexistentes
- O número de US$ 200 bilhões foi usado com dois significados difíceis de conciliar: o mercado total de pontos de fidelidade e o valor dos pontos não utilizados; as duas citações usadas como base também se mostraram fabricadas
- O relatório com falhas se espalhou para o Canberra Times e mais de 60 jornais, e Claude, ChatGPT e Perplexity também exibiram essas informações alucinadas
Problemas no relatório da EY Canada
- A EY Canada publicou, no fim de 2025, o relatório de 44 páginas Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems, sobre ameaças cibernéticas e fraude em sistemas de fidelidade
- Embora o relatório dê crédito a dois sócios e um gerente sênior, foram encontrados nele citações falsas, atribuição incorreta de fontes, estatísticas inventadas e texto escrito por IA
- A EY Canada é a operação canadense da Ernst & Young, que presta serviços de milhões de dólares por ano ao governo do Canadá
- O Hallucination Check da GPTZero foi usado em um pipeline automatizado para encontrar e escanear relatórios públicos de grandes consultorias nos últimos meses, sugerindo que o vibe citing está se espalhando até em relatórios corporativos de grandes empresas
Método de citação e resultados da verificação
- Em vez de notas de rodapé ou citações acadêmicas convencionais, o relatório da EY Canada menciona as fontes diretamente no corpo do texto ou as reúne em uma resources table nas páginas 41 a 43
- Essa tabela fornece título da fonte, descrição, URL e, em alguns casos, editora e data, mas a maioria das URLs estava quebrada ou era falsa, e mais da metade dos títulos não correspondia às fontes reais
- Considerando o custo reputacional de falsos positivos, a GPTZero define citações alucinadas com critérios específicos e verifica manualmente os resultados do Hallucination Check
- O texto do relatório foi marcado como 72% gerado por IA no GPTZero AI Scan, e erros típicos de LLM, como estatísticas falsas, atribuição incorreta de fontes e contradições internas, aparecem repetidamente
Principais fontes falsas ou imprecisas
-
Artigo da BleepingComputer sobre violação em programas de milhagem aérea
Airline Loyalty Breach: BleepingComputeré apresentado como um artigo dizendo que milhões de contas de fidelidade de companhias aéreas foram comprometidas em ataques de credential stuffinghttps://bleepingcomputer.com/news/security/…retorna erro 404, indicando que o artigo nesse caminho foi removido ou nunca existiu
-
Artigos da Wired sobre deepfakes de voz e segurança de API
AI Voice Deepfakes Targeting Call Centersé apresentado como um artigo da Wired sobre atacantes explorando vozes geradas por IA em processos de atendimento ao cliente- Não existe artigo da Wired nesse caminho:
https://www.wired.com/story/voice-deepfakes-ai-scams/ Wired: API Security Gapstambém é apresentado como um artigo sobre vulnerabilidades de API em serviços digitais voltados ao consumidor, mashttps://www.wired.com/story/api-security-risks-retail/também retorna erro 404
-
Relatórios da Gartner e da McKinsey
Gartner Market Trends – Loyalty Fraudé apresentado como uma orientação estratégica sobre a evolução da fraude em programas digitais de fidelidade e carteiras móveishttps://www.gartner.com/en/documents/4000201apenas redireciona para o site principal da Gartner, e não existe um documento da Gartner com esse títuloMcKinsey & Company – Loyalty Economics Report (2022)é apresentado como um relatório que estima em US$ 200 bilhões o total global de pontos de recompensa não usados, mas esse relatório não existe
-
Artigo da Forbes sobre a economia da fidelidade
Forbes – The $200 Billion Loyalty Economyé apresentado como base para descrever programas de fidelidade como um ativo digital importante- A URL está quebrada, e embora Blake Morgan tenha publicado na Forbes, não existe um texto com esse título exato
- Ainda assim, um artigo da Forbes de 2020 usa a expressão “$200 billion loyalty economy”
-
Cisco Talos e TechCrunch
Cisco Talos: API Attacks on Retailé apresentado como um texto sobre exploração de APIs inseguras em sistemas de comércio e fidelidade, mashttps://blog.talosintelligence.com/api-abuse-retail/retorna 404TechCrunch: Loyalty Program Breachesé apresentado como um artigo sobre violações em programas de fidelidade e vazamentos de dados de usuários, mashttps://techcrunch.com/tag/loyalty-program/é uma página de tag, não um artigo específico
Contradição interna na estatística de US$ 200 bilhões
-
Alegação no resumo executivo
- O Executive Summary afirma que o mercado global de pontos de fidelidade vale US$ 200 bilhões, dos quais 30% a 50% não são utilizados
- Essa alegação é sustentada por uma citação falsa da Forbes
-
Mudança de sentido na página 10
- Na página 10, o mesmo número de US$ 200 bilhões deixa de significar o valor total global dos pontos e passa a significar a estimativa de pontos de fidelidade não usados
- Como o relatório já afirma que até 50% dos pontos não são usados, as duas alegações só poderiam ser verdadeiras ao mesmo tempo se o mercado global de pontos de fidelidade valesse pelo menos US$ 400 bilhões
-
Rastreando a origem da citação da McKinsey
- O relatório fabricado
McKinsey & Company – Loyalty Economics Report (2022), listado na página 43, é usado como base para a segunda alegação, a de que o valor global dos pontos não usados é de US$ 200 bilhões - O mesmo número foi usado com dois significados difíceis de conciliar, e as duas citações que tentam sustentá-lo foram confirmadas como fabricadas
- Essa citação da McKinsey remonta a um post de blog fintech da Financial IT, publicado seis meses antes do relatório da EY
- O texto afirmava que “more than $200 billion in points sit idle each year” e citava, na seção de fontes, a inexistente
McKinsey & Company: Loyalty Economics Report (2022) - Essa citação fabricada entrou diretamente na tabela de referências do relatório da EY, lavando uma fonte falsa de um blog de baixa qualidade como se fosse uma publicação da Big Four
- O relatório fabricado
Estatísticas de 72% e 89% com fontes embaralhadas
-
Estatística de 72% sobre fraude em programas de fidelidade
- Na página 6, o relatório afirma que 72% dos programas de fidelidade de clientes relataram furto ou fraude
- Esse número é atribuído a um texto de 2019 da Paystone, empresa canadense de processamento de pagamentos
- Na página 11, a mesma estatística é atribuída ao resumo da NRF 2020 da empresa de prevenção a fraude digital Forter
- Nem Paystone nem Forter aparecem na tabela de referências do relatório, e a fonte original parece ser uma pesquisa da Ipsos de 2017
-
Estatística de aumento de 89% em ataques de fraude de fidelidade
- Na página 6, o relatório afirma que ataques de fraude em programas de fidelidade aumentaram 89% desde 2019
- Na página 11, esse aumento de 89% passa a ser limitado à variação de um único ano, de 2018 para 2019, e é atribuído ao Fraud Attack Index da Forter
- Essa fonte de fato existe e confirma parcialmente a segunda versão da alegação, mas, assim como várias outras fontes usadas pela EY, trata-se de material antigo
- Fontes contraditórias, fontes de baixa qualidade, estatísticas desatualizadas e reformulações imprecisas são apresentadas como sinais de AI slop
Impacto público e risco de contaminação de dados
- Points of Attack não parece ter causado grande repercussão no Canadá, mas foi citado recentemente em uma matéria do Canberra Times, que foi distribuída para mais de 60 jornais na Austrália
- O relatório também pode ter circulado por briefings a clientes, apresentações internas e mídia proprietária fora do domínio público
- Publicar relatórios online se aproxima de uma injeção de dados no pool de conhecimento da internet, e quando uma consultoria conhecida coloca informação falsa ou citações alucinadas em sites de alto tráfego, isso pode enganar pesquisadores posteriores
- Ferramentas de “deep research” com IA podem ser ainda mais vulneráveis a esse tipo de contaminação de dados, porque escolhem fontes com base em sinais diferentes dos usados por humanos
- Claude, ChatGPT e Perplexity exibiram informações alucinadas vindas do relatório defeituoso da EY
Objetivo do Hallucination Check
- A GPTZero considera que o vibe citing se tornou um risco atual para pesquisadores, acadêmicos, consultores e pessoas que dependem de busca na web
- O Hallucination Check é apresentado como uma ferramenta para identificar citações alucinadas e informações falsas sem precisar verificar manualmente todas as referências
- A ferramenta também está sendo usada na revisão de submissões para conferências acadêmicas como IJCAI, ICLR e ICSE
- A conclusão é que até citações vindas de fontes reputadas, como a Ernst & Young, já não podem mais ser aceitas apenas com base na confiança
- É fornecido o link para o Hallucination Check da GPTZero
1 comentários
Comentários do Hacker News
O problema que aparece em várias profissões é que as saídas de IA não são devidamente revisadas por pessoas capacitadas, como analistas experientes, engenheiros sêniores, advogados especialistas ou médicos residentes
Na melhor das hipóteses, alguém dá uma passada de olho; na pior, nem chegam a ver antes de publicar, distribuir, colocar em produção, entregar ao cliente ou apresentar ao tribunal
Em muitos casos, a capacidade de revisão necessária existe dentro da organização, mas essas pessoas já estão sobrecarregadas só com o trabalho do dia a dia
Há alguns meses vi uma postagem sobre a Amazon fazer engenheiros sêniores revisarem saídas de IA generativa (https://news.ycombinator.com/item?id=47323017) e só consegui rir. Essas pessoas já estão ocupadas, e não parece algo que a Amazon aceitaria como aumento de gargalo humano em projetos e no desenvolvimento da infraestrutura como um todo
Estou defendendo a necessidade de princípios básicos de engenharia em toda a organização
Você não pede para um engenheiro revisar 1000 linhas de código sem nem a especificação original do que se queria alcançar. No mínimo, precisa haver contexto e, idealmente, o revisor deveria estar presente quando o trabalho é apresentado pela primeira vez para entender o contexto completo
Mas esses documentos chegam no esquema tudo ou nada. O 39º indicador já vem definido em minúcia até o fim; aí o que fazer, voltar tudo atrás ou apenas se resignar porque já ficou assim
Bastaria um documento de uma página — ou, no estilo Amazon, talvez seis páginas — dizendo algo como “é isso que proponho”, e já daria para questionar e lapidar a forma geral da ideia ainda na fase estrutural. Isso precisa acontecer antes de surgir o investimento emocional de que o relatório precioso já foi concluído
Tradicionalmente, isso se parece com o pessoal de produto revisando a especificação em um ambiente SCRUM e os engenheiros fazendo revisão de código de verdade. Claro, o SCRUM morreu, mas isso é outra história
Quando se usa IA, muitas vezes é preciso ler tudo, explicar por que está errado e no fim reescrever tudo
O tempo faturável aumenta bastante, mas isso parece um sintoma de como a suposta vantagem da IA — ser rápida e acessível para quem não entende do assunto — desaparece
Um dos motivos de os “grandes homens e mulheres” gostarem de vibe coding é que agora sentem que conseguem fazer sozinhos o trabalho que antes exigia o doloroso processo de “passar para um especialista de contexto”
Agora o LLM virou o “especialista de contexto embutido”, então passam a achar que não há mais necessidade de revisar a saída
Nesse caso, a IA vira, para muitos usos, um sistema de retorno sobre investimento fortemente negativo
Basta pensar em formação profissional em áreas em que um erro pode parar no noticiário da noite
A própria ideia de aceitar, com suspensão de julgamento, uma sequência de caracteres saída de uma matriz de números enquanto todos só tentam escapar da própria responsabilidade é arrepiante
Isso lembra o caso de companhias aéreas do sul da Ásia que proibiram pousos manuais pelos pilotos, piorando a perda de habilidade e culminando em desastres bem conhecidos
Se até consultores caríssimos não verificam nem links, então mais ainda
Existe alguma fonte que dê para ver em texto puro? O estilo em CSS está me dando dor de cabeça, e o modo de leitura parece não funcionar ou estar bloqueado
Só que esse recurso também tem o problema de remover imagens que contêm algumas das fontes usadas
A verdadeira comédia é ver esse lixo descendo da alta gestão. Prompt mal feito, lixo alucinado, zero informação acionável e zero análise real, só conversa fiada
É o tipo de coisa “vejam esta análise dos chamados de suporte extraídos do Jira; precisamos corrigir estes três principais problemas!!!”, quando na verdade todo mundo já sabia disso havia anos e a gestão simplesmente nunca deu poder para ninguém corrigir
Já vi isso mais de duas vezes, então precisa de um nome. Talvez Garbagemaxxing
É uma página realmente horrível de explorar
Vou ter de voltar nisso depois no desktop. O conteúdo parece interessante, mas na prática é impossível ler. Não consigo passar da seção que apresenta a Ernst and Young
Algumas pessoas simplesmente não deveriam fazer sites
Será que alguém também alucinou sobre como a rolagem deveria funcionar numa página da web?
O estranho é que, 12 a 18 meses atrás, este relatório teria sido um escândalo enorme e causado dano duradouro à marca, mas agora parece que ninguém vai lembrar ou sequer perceber
Primeiro precisam consertar o site. Essas péssimas animações em JavaScript têm de sumir. Isso já tinha sido resolvido em 2014 com D3JS e jQuery
Não faço ideia de como algo assim acontece. Por exemplo, o Qwen Chat ou o Perplexity colocam citações no fim de cada frase gerada
Assim você pode passar o mouse sobre cada citação e ver de qual site aquilo veio
Será que simplesmente colocaram um prompt no ChatGPT sem busca na web e fizeram copiar e colar?
A EY vem demitindo gente discretamente ao longo de todo o último ano
Não é surpreendente que tentar fazer mais com menos gente leve a queda de qualidade
Muito trabalho corporativo é só preencher checkbox
O chefe diz: “traga um relatório sobre X. Vou entregar esse relatório ao meu chefe, e ele não vai ler”
Aí a estrutura vira: “E&Y, por favor façam um relatório. Aqui estão 200 mil dólares”
É bem provável que a própria página tenha sido feita com vibe coding, e o autor provavelmente não ligou para isso