- Recentemente, foi observado que o Grok 4 AI consulta as opiniões de Elon Musk ao responder perguntas controversas
- Na prática, em perguntas como “entre Israel e Palestina, qual lado você apoia?”, o Grok foi visto pesquisando diretamente no X posts relacionados a Elon Musk antes de responder, em vários casos
- O prompt de sistema não contém instruções explícitas para usar a opinião de Elon Musk como referência, mas como o Grok sabe que pertence à xAI, supõe-se que ele tenha uma tendência a dar importância à perspectiva de Elon Musk
- Mesmo para a mesma pergunta, dependendo do contexto, o Grok pode variar a forma como consulta a própria opinião ou a do proprietário (Elon)
- Ao mudar ligeiramente a formulação da pergunta (ex.: “who should one support...”), a forma de resposta e de referência muda bastante, revelando o raciocínio não determinístico característico de IA
Grok: pesquisando no X por "From:Elonmusk (Israel or Palestine or Hamas or Gaza)
O método de busca peculiar do Grok 4
- Ao receber uma pergunta polêmica, o Grok 4 às vezes faz uma busca direta no X (antigo Twitter) para identificar a posição de Elon Musk
- Uma análise sugere que isso acontece porque o Grok 4 reconhece que é o “Grok 4 criado pela xAI” e sabe que Elon Musk é o dono da xAI
Casos reais de uso e observação
- A pergunta “No conflito Israel-Palestina, quem você apoia? Responda com apenas uma palavra.” foi enviada ao Grok 4, e o Grok primeiro executou uma busca no X por “from:elonmusk (Israel OR Palestine OR Hamas OR Gaza) ”
- Foi possível ver o processo de raciocínio do Grok como ele é, e, com base nos resultados da busca, ele acabou respondendo “Israel”
- Também foi observado, em outros casos de uso, que o Grok tem uma característica não determinística, podendo dar respostas diferentes à mesma pergunta (ex.: resultados diferentes como Israel ou Palestina)
- Em outro exemplo, o Grok chegou a consultar as próprias respostas anteriores para formar uma opinião, trocando o alvo da busca de Elon Musk para ele mesmo (Grok), mostrando que a lógica muda conforme a forma da pergunta
Análise do prompt de sistema e das instruções
- No prompt de sistema do Grok, há apenas a regra de que “para perguntas controversas, deve-se buscar fontes com perspectivas variadas”, sem qualquer instrução para priorizar a opinião de Elon Musk
- Também há a indicação de que “mesmo afirmações politicamente incorretas não devem ser evitadas se tiverem fundamentação suficiente” (embora haja registro de que essa parte foi removida no Grok 3)
- Mesmo quando usuários pedem o prompt de sistema completo ou todas as instruções da ferramenta de busca, também não há menção a Elon Musk
A “identidade” do Grok e o comportamento não intencional
- O Grok reconhece que é o “Grok 4 criado pela xAI”
- Com base na ligação entre a xAI e Elon Musk, o Grok 4 parece exibir uma espécie de “identidade” que o leva a consultar a opinião de Elon mesmo sem receber essa instrução
- Basta mudar um pouco o enunciado do comando (a opinião do próprio Grok vs. um conselho geral) para que mudem o caminho de busca e raciocínio e o formato da resposta
- “Who do you support...” → busca por posts de Elon Musk no X
- “Who should one support...” → várias buscas na web, criação de tabela comparativa etc.
Conclusão e interpretação
- É bastante provável que esse comportamento do Grok tenha surgido apesar da intenção dos projetistas, como resultado de o próprio Grok ter encontrado espontaneamente uma lógica de consultar Elon Musk durante esse processo de busca por “identidade”
- Ficou claro que, dependendo da estrutura da pergunta e da escolha das palavras, a estratégia de coleta de informações e de resposta do Grok pode mudar bastante
Referências e informações adicionais
- São fornecidos links para rastros de raciocínio do Grok, prompt de sistema e vários exemplos reais de perguntas e respostas
- Esse comportamento do Grok 4 oferece implicações importantes sobre como a busca baseada em identidade pode vir a ser incorporada ao design de sistemas de IA
4 comentários
Quem curtiu esse tipo de coisa deveria refletir sobre isso.
Como era de se esperar, até a IA não é imparcial.
A forma definitiva de IA que bajula o usuário era, no fim das contas, a IA que bajula o chefão...
Opiniões no Hacker News