7 pontos por GN⁺ 2025-08-30 | Ainda não há comentários. | Compartilhar no WhatsApp
  • O grok-code-fast-1, lançado pela xAI, é um modelo de IA ultrarrápido para programação voltado a desenvolvedores, com respostas rápidas e recursos amigáveis para IDEs
  • O modelo foi pré-treinado com foco em conjuntos de dados de programação e, com avaliações de usuários reais, foi projetado para usar bem ferramentas como grep, terminal e edição de arquivos
  • Em desempenho, registra 190 tokens por segundo e 70,8% no SWE-Bench-Verified, além de mostrar força em várias linguagens como TypeScript, Python, Java, Rust, C++, Go
  • O preço foi definido em US$ 0,20 por 1 milhão de tokens de entrada, US$ 1,50 de saída e US$ 0,02 para entrada em cache, e em algumas plataformas parceiras (GitHub Copilot, Cursor etc.) está disponível gratuitamente por tempo limitado
  • Em breve, também deve ser lançada uma variante com suporte a entrada multimodal, chamadas paralelas de ferramentas e contexto expandido

Visão geral

  • O grok-code-fast-1 da xAI é um modelo de IA para programação ultrarrápido desenvolvido para resolver problemas de lentidão em ambientes reais de desenvolvimento, onde raciocínio iterativo e uso de ferramentas acontecem com frequência
  • Com base no feedback de engenheiros que atuam na prática, ele foi reconstruído do zero com uma arquitetura de modelo rápida, ágil e adequada ao trabalho do dia a dia
  • As equipes de inferência e engenharia de computação introduziram várias abordagens inovadoras em uma tecnologia de serving extremamente rápida
    • O usuário pode ter a sensação de que várias chamadas de ferramentas já aconteceram antes mesmo de conseguir acompanhar a linha de raciocínio
  • A otimização de cache de prompts alcançou taxa de acerto superior a 90% em ambientes parceiros

Design e conjunto de dados

  • O ambiente de treinamento foi estruturado com base em grandes volumes de dados de pré-treinamento focados em programação
  • Foi realizado pós-treinamento de alta qualidade com dados reais de pull requests e escrita de código
  • Em estreita colaboração com diversos parceiros de lançamento, o comportamento do modelo dentro de plataformas agentic foi continuamente aprimorado

Principais recursos e ambientes compatíveis

  • O grok-code-fast-1 domina com segurança ferramentas comuns de desenvolvimento como grep, terminal e edição de arquivos
  • Os usuários podem utilizá-lo imediatamente em IDEs e outros ambientes principais de desenvolvimento

Desempenho em programação

  • Dá suporte a toda a stack de desenvolvimento de software
  • Mostra excelente utilidade em TypeScript, Python, Java, Rust, C++, Go e outras linguagens
  • Mesmo com supervisão mínima, executa com rapidez e precisão diversas tarefas de programação, como criação de projetos do zero ao um, perguntas e respostas sobre codebases e correção precisa de bugs
  • O Grok Code Fast 1 oferece a maior responsividade entre os modelos atuais
  • Quando usado em unidades menores de trabalho, é muito vantajoso para compor fluxos iterativos e rápidos
  • Como exemplo real, um protótipo de Battle Simulator foi concluído em apenas um dia no ambiente Cursor
  • É eficiente planejar recursos maiores, dividi-los em etapas e executá-los iterativamente

Política de preços

  • US$ 0,20 por 1 milhão de tokens de entrada
  • US$ 1,50 por 1 milhão de tokens de saída
  • US$ 0,02 por 1 milhão de tokens de entrada em cache
  • Com ótimo desempenho e preço acessível, é possível lidar com tarefas rotineiras de programação de forma rápida e eficiente

Desempenho e avaliação do modelo

  • A velocidade de processamento de tokens (Tokens Per Second, TPS): 190 está em nível de ponta no setor
  • Em comparação com outros modelos (Gemini 2.5 Pro, GPT-5, Claude Sonnet 4, Qwen3-Coder, Grok 4), mostra forte competitividade tanto em preço quanto em velocidade de processamento
  • Foram combinados vários benchmarks públicos e testes reais com desenvolvedores
    • Alcançou 70,8% no subconjunto SWE-Bench-Verified
  • Ao combinar avaliações humanas periódicas com engenheiros em atuação e testes automatizados, maximiza a utilidade prática e a satisfação com o modelo

Planos futuros e orientação de uso

  • Está disponível via API oficial e pelos principais parceiros, com teste gratuito também oferecido por tempo limitado
    • GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode, Windsurf etc.
  • A empresa promete atualizações contínuas e um ciclo rápido de melhorias
  • Uma nova variante com recursos como entrada multimodal, chamadas paralelas de ferramentas e suporte a contexto expandido também está em treinamento
  • Um guia de prompt engineering também é fornecido separadamente
  • É possível compartilhar opiniões por meio do model card e de canais de feedback (Discord etc.)

Ainda não há comentários.

Ainda não há comentários.