- O grok-code-fast-1, lançado pela xAI, é um modelo de IA ultrarrápido para programação voltado a desenvolvedores, com respostas rápidas e recursos amigáveis para IDEs
- O modelo foi pré-treinado com foco em conjuntos de dados de programação e, com avaliações de usuários reais, foi projetado para usar bem ferramentas como grep, terminal e edição de arquivos
- Em desempenho, registra 190 tokens por segundo e 70,8% no SWE-Bench-Verified, além de mostrar força em várias linguagens como TypeScript, Python, Java, Rust, C++, Go
- O preço foi definido em US$ 0,20 por 1 milhão de tokens de entrada, US$ 1,50 de saída e US$ 0,02 para entrada em cache, e em algumas plataformas parceiras (GitHub Copilot, Cursor etc.) está disponível gratuitamente por tempo limitado
- Em breve, também deve ser lançada uma variante com suporte a entrada multimodal, chamadas paralelas de ferramentas e contexto expandido
Visão geral
- O grok-code-fast-1 da xAI é um modelo de IA para programação ultrarrápido desenvolvido para resolver problemas de lentidão em ambientes reais de desenvolvimento, onde raciocínio iterativo e uso de ferramentas acontecem com frequência
- Com base no feedback de engenheiros que atuam na prática, ele foi reconstruído do zero com uma arquitetura de modelo rápida, ágil e adequada ao trabalho do dia a dia
- As equipes de inferência e engenharia de computação introduziram várias abordagens inovadoras em uma tecnologia de serving extremamente rápida
- O usuário pode ter a sensação de que várias chamadas de ferramentas já aconteceram antes mesmo de conseguir acompanhar a linha de raciocínio
- A otimização de cache de prompts alcançou taxa de acerto superior a 90% em ambientes parceiros
Design e conjunto de dados
- O ambiente de treinamento foi estruturado com base em grandes volumes de dados de pré-treinamento focados em programação
- Foi realizado pós-treinamento de alta qualidade com dados reais de pull requests e escrita de código
- Em estreita colaboração com diversos parceiros de lançamento, o comportamento do modelo dentro de plataformas agentic foi continuamente aprimorado
Principais recursos e ambientes compatíveis
- O
grok-code-fast-1 domina com segurança ferramentas comuns de desenvolvimento como grep, terminal e edição de arquivos
- Os usuários podem utilizá-lo imediatamente em IDEs e outros ambientes principais de desenvolvimento
Desempenho em programação
- Dá suporte a toda a stack de desenvolvimento de software
- Mostra excelente utilidade em TypeScript, Python, Java, Rust, C++, Go e outras linguagens
- Mesmo com supervisão mínima, executa com rapidez e precisão diversas tarefas de programação, como criação de projetos do zero ao um, perguntas e respostas sobre codebases e correção precisa de bugs
- O Grok Code Fast 1 oferece a maior responsividade entre os modelos atuais
- Quando usado em unidades menores de trabalho, é muito vantajoso para compor fluxos iterativos e rápidos
- Como exemplo real, um protótipo de Battle Simulator foi concluído em apenas um dia no ambiente Cursor
- É eficiente planejar recursos maiores, dividi-los em etapas e executá-los iterativamente
Política de preços
- US$ 0,20 por 1 milhão de tokens de entrada
- US$ 1,50 por 1 milhão de tokens de saída
- US$ 0,02 por 1 milhão de tokens de entrada em cache
- Com ótimo desempenho e preço acessível, é possível lidar com tarefas rotineiras de programação de forma rápida e eficiente
Desempenho e avaliação do modelo
- A velocidade de processamento de tokens (Tokens Per Second, TPS): 190 está em nível de ponta no setor
- Em comparação com outros modelos (Gemini 2.5 Pro, GPT-5, Claude Sonnet 4, Qwen3-Coder, Grok 4), mostra forte competitividade tanto em preço quanto em velocidade de processamento
- Foram combinados vários benchmarks públicos e testes reais com desenvolvedores
- Alcançou 70,8% no subconjunto SWE-Bench-Verified
- Ao combinar avaliações humanas periódicas com engenheiros em atuação e testes automatizados, maximiza a utilidade prática e a satisfação com o modelo
Planos futuros e orientação de uso
- Está disponível via API oficial e pelos principais parceiros, com teste gratuito também oferecido por tempo limitado
- GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode, Windsurf etc.
- A empresa promete atualizações contínuas e um ciclo rápido de melhorias
- Uma nova variante com recursos como entrada multimodal, chamadas paralelas de ferramentas e suporte a contexto expandido também está em treinamento
- Um guia de prompt engineering também é fornecido separadamente
- É possível compartilhar opiniões por meio do model card e de canais de feedback (Discord etc.)
Ainda não há comentários.