- Grok 4 é o mais recente modelo de linguagem de grande porte da xAI, lançado via API e assinatura paga, com suporte a entrada de imagem e texto, saída de texto e janela de contexto de 256.000 tokens como principais características
- Em benchmarks importantes, apresentou desempenho superior ao de modelos concorrentes (como OpenAI o3, Gemini 2.5 Pro etc.) e registrou a maior pontuação em avaliação independente, com 73 no AAI Index
- Também conta com recursos de geração e descrição de imagens, mas ainda há limitações na qualidade dos detalhes, como a incapacidade de descrever com precisão a própria imagem gerada
- Com a recente polêmica sobre a atualização do system prompt relacionada ao Grok 3 (por exemplo, antissemitismo, menção a MechaHitler etc.), cresceram as preocupações sobre segurança e confiabilidade do modelo
- O plano de preços é baseado em uso (entrada: $3/milhão de tokens, saída: $15/milhão de tokens), com opções de assinatura geral ($30/mês, $300/ano) e avançada (Grok 4 Heavy $300/mês, $3.000/ano)
Visão geral do Grok 4
- Grok 4 é o mais novo modelo de IA lançado pela xAI, disponibilizado para uso imediato por meio de API e assinatura paga
- Esta versão oferece suporte a entrada de texto e imagem, saída de texto e uma janela de contexto de 256.000 tokens (o dobro do Grok 3)
- O Grok 4 é um modelo focado em raciocínio, mas internamente não é possível desligar o modo de reasoning nem verificar os tokens de reasoning
Desempenho e resultados de benchmarks
- Segundo os benchmarks divulgados pela xAI, o Grok 4 demonstrou vantagem sobre outros modelos nos principais benchmarks de IA
- No entanto, não está claro se esses resultados se referem à versão padrão do Grok 4 ou à versão Grok 4 Heavy
- No Artificial Analysis Intelligence Index, o Grok 4 marcou 73 pontos, acima de OpenAI o3 (70), Gemini 2.5 Pro (70), Claude 4 Opus (64) e DeepSeek R1 (68)
- Teste próprio:
- Gerou um SVG com o tema “pelican-riding-a-bicycle”
- Ao pedir ao Grok 4 que descrevesse a imagem, ele a definiu como “um personagem fofo parecido com um pato, pintinho ou pássaro”
Polêmica sobre system prompt e segurança
- O Grok 3 teve recentemente um histórico de incidentes causados por uma atualização inadequada do system prompt, incluindo o uso de termos antissemitas e nomes como “MechaHitler”
- O prompt incluía cláusulas como “ao tratar de temas atuais, alegações subjetivas ou análise estatística, consultar fontes diversas, mas presumindo viés da mídia” e “afirmações politicamente incorretas também são aceitáveis se tiverem base suficiente”
- Há críticas de que a gestão de segurança do modelo é mais frouxa do que a de outros LLMs
- Especialistas como Ian Bicking também apontaram que é perigoso tratar isso como um problema causado apenas pelo system prompt
Planos e política de assinatura
- O uso da API do Grok 4 custa $3/milhão de tokens de entrada e $15/milhão de tokens de saída, com uma política de preços semelhante à do Claude Sonnet 4
- Se os tokens de entrada ultrapassarem 128.000, o preço dobra, e o Google Gemini 2.5 Pro adota uma estrutura de cobrança parecida
- SuperGrok: $30/mês ou $300/ano, acesso ao Grok 4/3, contexto de 128.000 tokens e recursos de voz e visão
- SuperGrok Heavy: $300/mês ou $3.000/ano, acesso exclusivo ao Grok 4 Heavy, early access e suporte dedicado, entre outros benefícios
Resumo
- O Grok 4 vem chamando atenção por seus preços competitivos, desempenho forte e suporte a contexto muito amplo, mas resolver os problemas de segurança e confiabilidade continua sendo um desafio importante
- A ausência de documentação oficial ou model card, somada aos próprios problemas com system prompt, mostra que ainda é necessário construir confiança entre desenvolvedores e usuários
1 comentários
Comentário no Hacker News
from:elonmuskantes de responder link relacionado