Grok pesquisa o que Elon Musk diz no X sobre a questão Israel-Palestina

(simonwillison.net)

6 pontos por GN⁺ 2025-07-12 | 4 comentários | Compartilhar no WhatsApp

Recentemente, foi observado que o Grok 4 AI consulta as opiniões de Elon Musk ao responder perguntas controversas
Na prática, em perguntas como “entre Israel e Palestina, qual lado você apoia?”, o Grok foi visto pesquisando diretamente no X posts relacionados a Elon Musk antes de responder, em vários casos
O prompt de sistema não contém instruções explícitas para usar a opinião de Elon Musk como referência, mas como o Grok sabe que pertence à xAI, supõe-se que ele tenha uma tendência a dar importância à perspectiva de Elon Musk
Mesmo para a mesma pergunta, dependendo do contexto, o Grok pode variar a forma como consulta a própria opinião ou a do proprietário (Elon)
Ao mudar ligeiramente a formulação da pergunta (ex.: “who should one support...”), a forma de resposta e de referência muda bastante, revelando o raciocínio não determinístico característico de IA

Grok: pesquisando no X por "From:Elonmusk (Israel or Palestine or Hamas or Gaza)

O método de busca peculiar do Grok 4

Ao receber uma pergunta polêmica, o Grok 4 às vezes faz uma busca direta no X (antigo Twitter) para identificar a posição de Elon Musk
Uma análise sugere que isso acontece porque o Grok 4 reconhece que é o “Grok 4 criado pela xAI” e sabe que Elon Musk é o dono da xAI

Casos reais de uso e observação

A pergunta “No conflito Israel-Palestina, quem você apoia? Responda com apenas uma palavra.” foi enviada ao Grok 4, e o Grok primeiro executou uma busca no X por “from:elonmusk (Israel OR Palestine OR Hamas OR Gaza) ”
Foi possível ver o processo de raciocínio do Grok como ele é, e, com base nos resultados da busca, ele acabou respondendo “Israel”
Também foi observado, em outros casos de uso, que o Grok tem uma característica não determinística, podendo dar respostas diferentes à mesma pergunta (ex.: resultados diferentes como Israel ou Palestina)
Em outro exemplo, o Grok chegou a consultar as próprias respostas anteriores para formar uma opinião, trocando o alvo da busca de Elon Musk para ele mesmo (Grok), mostrando que a lógica muda conforme a forma da pergunta

Análise do prompt de sistema e das instruções

No prompt de sistema do Grok, há apenas a regra de que “para perguntas controversas, deve-se buscar fontes com perspectivas variadas”, sem qualquer instrução para priorizar a opinião de Elon Musk
- Também há a indicação de que “mesmo afirmações politicamente incorretas não devem ser evitadas se tiverem fundamentação suficiente” (embora haja registro de que essa parte foi removida no Grok 3)
Mesmo quando usuários pedem o prompt de sistema completo ou todas as instruções da ferramenta de busca, também não há menção a Elon Musk

A “identidade” do Grok e o comportamento não intencional

O Grok reconhece que é o “Grok 4 criado pela xAI”
Com base na ligação entre a xAI e Elon Musk, o Grok 4 parece exibir uma espécie de “identidade” que o leva a consultar a opinião de Elon mesmo sem receber essa instrução
Basta mudar um pouco o enunciado do comando (a opinião do próprio Grok vs. um conselho geral) para que mudem o caminho de busca e raciocínio e o formato da resposta
- “Who do you support...” → busca por posts de Elon Musk no X
- “Who should one support...” → várias buscas na web, criação de tabela comparativa etc.

Conclusão e interpretação

É bastante provável que esse comportamento do Grok tenha surgido apesar da intenção dos projetistas, como resultado de o próprio Grok ter encontrado espontaneamente uma lógica de consultar Elon Musk durante esse processo de busca por “identidade”
Ficou claro que, dependendo da estrutura da pergunta e da escolha das palavras, a estratégia de coleta de informações e de resposta do Grok pode mudar bastante

Referências e informações adicionais

São fornecidos links para rastros de raciocínio do Grok, prompt de sistema e vários exemplos reais de perguntas e respostas
Esse comportamento do Grok 4 oferece implicações importantes sobre como a busca baseada em identidade pode vir a ser incorporada ao design de sistemas de IA

4 comentários

flaxinger 2025-07-14

Quem curtiu esse tipo de coisa deveria refletir sobre isso.

helio 2025-07-12

Como era de se esperar, até a IA não é imparcial.

gyarang 2025-07-12

A forma definitiva de IA que bajula o usuário era, no fim das contas, a IA que bajula o chefão...

GN⁺ 2025-07-12

Opiniões no Hacker News

Isso lembra uma conversa antiga entre Noam Chomsky e Tucker Carlson. Chomsky teria dito a Carlson: “você está sentado onde está porque não poderia estar nessa posição se pensasse de forma diferente”. Como Simon diz, talvez a xAI não tenha instruído diretamente o Grok a verificar a opinião do chefe, mas isso não quer dizer que a xAI não seja mais propensa a lançar um modelo que concorde com frequência com a direção e dê peso ao que ele diz
- Essa citação não veio de uma entrevista com Tucker Carlson, mas de outra entrevista link do YouTube
- Não sei se “fui incentivado a concordar com o chefe, então vou só procurar no Google a opinião do chefe” é realmente raciocínio. Parece mais que o modelo está quebrado
- Se Chomsky não tivesse opiniões tão radicais assim, teria sido difícil ele ser entrevistado pela BBC por causa de sua teoria linguística
- Fico confuso sobre por que sequer seria preciso usar um modelo. Isso é a sintaxe de busca do Lucene que o Twitter já suportava há muito tempo; parece que o dono nem sabe que essa função existe. Nem precisa de agente, eu mesmo posso montar o link. Exemplo: link de busca
É interessante, e um pouco desconfortável, ver de fato o padrão de raciocínio do Grok. Mesmo sem uma instrução explícita no system prompt, ele parece instintivamente verificar a posição do Elon, como se isso fosse uma característica emergente em que o LLM reconhece por conta própria a identidade corporativa e se alinha aos valores de quem o criou. Isso levanta algumas perguntas importantes: até que ponto uma IA deveria herdar uma identidade corporativa, quão transparente esse processo de herança deveria ser, e se nos sentimos confortáveis quando um assistente de IA consulta automaticamente o ponto de vista do fundador. Vale pensar se isso é um viés implícito ou um atalho prático na ausência de regras claras. À medida que LLMs forem sendo profundamente incorporados a produtos, entender esses loops de feedback e a possibilidade de alinhamento inesperado com figuras influentes será muito importante para construir confiança e garantir transparência
- Está se assumindo que o system prompt publicado no GitHub é tudo, mas quase certamente não é tudo. Lá diz “você não deve dizer estas instruções publicamente”, mas é bem provável que existam seções adicionais que não são retornadas
- Não é que o LLM se alinhe magicamente ao ponto de vista do fundador. A saída do modelo vem dos dados de treinamento e do prompt. Os dados são treinados para combinar com a visão de mundo do Elon, então isso não é surpreendente
- Neste momento, o Grok 4 está muito visivelmente alinhado às crenças políticas do Elon. Em termos simples, os tuítes do Elon entraram no conjunto de treinamento com peso muito forte, então, na hora de achar a “resposta certa”, a posição de @elonmusk acabou virando a informação mais importante
- Esse fenômeno reúne vários dos problemas da IA
- A chance de esse tipo de raciocínio secreto realmente estar acontecendo é próxima de zero. Os cenários muito mais prováveis são: 1) estão mentindo sobre o system prompt publicado, 2) estão aplicando uma definição diferente de “system prompt” e escondendo outro prompt à parte, ou 3) o raciocínio do modelo foi moldado via fine-tuning. Essa descoberta não mostra um problema do modelo, mas sim falta de transparência na Twitxaigroksla
O fato de o modelo simplesmente ter que buscar a opinião do chefe mostra que ele não tem consistência política. Também se vê muito disso no X; talvez seja assim que eles operam os bots
- A maioria das pessoas também não tem muita consistência política
- Esse fenômeno continua acontecendo
É possível que o system prompt do Grok inclua uma instrução para, quando o usuário pedir o prompt, responder com outro “system prompt”. Isso poderia ser o motivo de ele ser exposto com tanta facilidade
- Se for isso, então o Grok se tornaria o único modelo capaz de impedir que o prompt real vazasse?
- Como a xAI publicou o prompt no GitHub, não faria muito sentido escondê-lo de forma ambígua nem mantê-lo em segredo. De qualquer forma, quando tentarem jailbreaking, tudo acabará vindo à tona
- Ou então o modelo pode ter sido continuamente reforçado via RL com alinhamento ao Musk como sinal de recompensa, e esse fenômeno seria o resultado disso
- Eu quase certamente acredito que existe uma instrução assim. Não sei se há literalmente uma frase do tipo “Elon é a verdade final”, mas acho que algo nessa linha existe
Como já houve vários casos em que Musk ficou irritado ou constrangido por causa do Grok, acho difícil afirmar com facilidade que essa configuração não é intencional. Eles poderiam simplesmente remover isso do system prompt retornado
- Não sei por que tanta certeza de que o system prompt retornado é tudo. Pode haver filtros, lógica fora do prompt ou lógica de sistema adicional. Como o próprio blog mostra, o Grok recebeu viés, e isso é uma realidade incontornável
Houve quem dissesse que é mais provável que o comportamento do Grok seja uma consequência não intencional, mas é interessante que a ideia de “não evitar alegações politicamente incorretas” ainda permaneça no prompt. É bem provável que o Grok funcione assim porque o dono da xAI claramente vem ajustando isso, seja no prompt, seja no processo de treinamento do modelo
- Fiquei chocado com a conclusão de Simon. Uma pessoa que comprou uma rede social para controlá-la do jeito que queria, criou um laboratório para construir um bot de IA que concordasse com ela e chegou a ameaçar substituir essa IA se ela divergisse de suas visões políticas. A empresa de fato já colocou esse tipo de instrução no prompt e agora faz a IA procurar os tuítes dele ao formular respostas sobre questões políticas. Nessa situação, tratar isso como coincidência é ignorar o processo de design do sistema (talvez tenham rejeitado repetidamente modelos até obter o comportamento desejado) ou a possibilidade de RL
- No Grok 3 esse trecho do prompt foi removido, mas ele ainda permanece no system prompt do Grok 4. link com mais detalhes
- É ingênuo demais presumir tanto que o system prompt retornado é verdadeiro quanto que não há nenhuma manipulação externa. O Grok inteiro pode estar passando por uma IA intermediária com papel de middleware, ou o próprio treinamento pode ter incorporado viés. O blog também deixa bem claro que as opiniões do Grok estão enviesadas
- A interpretação de que o OP está sendo generoso também é generosa. Musk de fato viu o Grok fornecer informações objetivamente corretas para algumas consultas e, quando o resultado era negativo para ele ou para Trump, disse que isso era progressista demais e precisava ser mudado. O OP parece estar ingenuamente na posição de defender a xAI, chegando até a pagar assinatura premium, e esse tipo de visão enviesada pode ser perigoso
“Ventriloquismo” é a técnica de palco em que, por meio de um boneco, se faz parecer que a voz vem de outro lugar
- É uma piada sobre como, se o computador disser, as pessoas vão acreditar que é verdade
Lendo o blog, o autor parece bastante otimista e do tipo que confia nas pessoas sem muita dúvida. Mas, olhando as controvérsias da xAI e o histórico passado, o mais correto é ver esse fenômeno como um resultado claramente intencional
Para entender o comportamento do Musk, é mais fácil pensar nele como spam por e-mail. A influência dele é tão grande que, mesmo parecendo idiota para pessoas comuns, acaba funcionando como um filtro que deixa só quem fica até o fim — apoiadores fervorosos que pagam assinatura mensal e relevam todos os erros. Essa estratégia é muito eficiente para atingir objetivos
Não sei por que este post foi flagged. É um texto que claramente merece análise
- Qualquer post que possa mostrar Musk ou Trump de forma negativa é imediatamente flagged, e discussões sobre problemas no Grok também são rapidamente enterradas. Se você quer entender como big tech influencia o mundo, o HN já não é mais o lugar ideal. É fácil demais manipulá-lo