- O Grok 4 Fast, anunciado pela xAI, é um modelo de raciocínio de próxima geração baseado nos resultados de treinamento do Grok 4 existente, maximizando eficiência de custo e velocidade
- O modelo conta com janela de contexto de 2M tokens, busca na web e no X, além de uma arquitetura integrada de reasoning / non-reasoning, sendo adequado para uso em tempo real
- Nos benchmarks, entrega desempenho semelhante ao do Grok 4 usando em média 40% menos tokens, permitindo atingir o mesmo nível de desempenho com custo muito menor
- Além disso, por meio de aprendizado por reforço para uso de ferramentas, apresenta alto desempenho em execução de código, navegação na web e mais, ficando em 1º lugar no LMArena Search Arena
Avanço da inteligência com eficiência de custo
- O Grok 4 Fast mostra desempenho superior ao Grok 3 Mini e, ao mesmo tempo, reduz significativamente o custo de tokens
- Em média, atinge desempenho semelhante ao do Grok 4 usando 40% menos 'Thinking Tokens'
- Exemplos de pontuação em benchmarks (pass@1):
- Grok 4 Fast: 85.7%, 92.0%, 93.3%, 20.0%, 80.0%
- Resultados equivalentes ou superiores aos de modelos concorrentes (como GPT-5)
- Em vários benchmarks de raciocínio, como GPQA, AIME, HMMT e LiveCodeBench, mostrou resultados próximos aos do Grok 4
- Junto com uma melhora de 40% na eficiência de tokens do Grok 4 Fast, o preço por token foi bastante reduzido
- Ao atingir o mesmo desempenho, o preço é 98% menor que o do Grok 4, estabelecendo a melhor 'SOTA Price-to-Intelligence Ratio' entre os modelos públicos
- O excelente resultado foi validado em avaliação externa do índice Artificial Analysis Intelligence Index, uma instituição independente
Uso nativo de ferramentas e busca SOTA
- Treinado com aprendizado por reforço para uso de ferramentas (RL), ele pode executar código ou navegar na web automaticamente quando necessário
- Possui capacidade de busca agentic para explorar a web e o X em tempo real, realizando buscas multi-hop e lidando até com mídia (imagens e vídeos)
- Em vários benchmarks, como BrowseComp, SimpleQA e X Bench Deepsearch(zh), alcança desempenho superior ao do Grok 4
Resultados de pós-treinamento em domínio geral
- No Search Arena do LMArena, o Grok 4 Fast (
menlo) ficou em 1º lugar com Elo 1163, liderando por 17 pontos sobre os modelos concorrentes
- No Text Arena,
grok-4-fast (codinome tahoe) ficou em 8º lugar, com desempenho esmagadoramente superior em comparação com outros modelos da mesma categoria (18º lugar ou abaixo)
- Em tarefas reais de busca e texto, mostra eficiência superior até à de modelos maiores
Modelo integrado de Reasoning e Non-Reasoning
- Modos de reasoning / non-reasoning, que antes exigiam modelos separados, foram integrados em uma arquitetura única
- É possível alternar entre os modos reasoning (pensamento profundo) e non-reasoning (resposta rápida) apenas com o system prompt
- Com menor latência de ponta a ponta e menor custo de tokens, é adequado para aplicações em tempo real
- Na API da xAI, os desenvolvedores podem ajustar com precisão o nível de velocidade/profundidade
Disponibilização e política de preços
- O Grok 4 Fast já está disponível e é oferecido gratuitamente por tempo limitado no OpenRouter e no Vercel AI Gateway
- Na API da xAI, também é oferecido em duas versões,
grok-4-fast-reasoning e grok-4-fast-non-reasoning, com suporte a janela de contexto de 2M tokens
- O preço começa em $0.20/1M tokens de entrada e $0.50/1M tokens de saída, com tarifa dobrada acima de 128k tokens
- Tokens de entrada em cache são oferecidos por $0.05/1M, ajudando a reduzir custos
Planos futuros
- O modelo continuará sendo aprimorado continuamente com base no feedback dos usuários
- Recursos multimodais e reforço das características agentic são os principais objetivos da próxima atualização
- O model card e mais detalhes podem ser consultados em Model card do Grok 4 Fast (PDF)
2 comentários
Parece ser mais caro e mais lento que o gpt-oss, então fico curioso para saber por que tanta gente está usando..
Comentários do Hacker News