Cursor Composer 2.5 se torna o modelo mais escolhido dentro do Cursor — bônus de uso 10x
(x.com/mntruell)- O CEO da Cursor, Michael Truell, anunciou no X que “o Composer 2.5 se tornou o modelo mais escolhido no Cursor. Estamos oferecendo 10x de uso para todos os usuários por um dia”
- Isso sinaliza uma rápida alta na adoção logo após o lançamento, com o modelo próprio passando a ser escolhido por padrão no lugar de modelos da Anthropic/OpenAI
Resumo dos principais pontos do Composer 2.5
• Modelo proprietário de codificação agêntica de 3ª geração da Cursor, lançado oficialmente em 18 de maio
• Usa como base o Kimi K2.5, open source da Moonshot AI, o mesmo do Composer 2, e desta vez isso foi explicitamente informado já no primeiro parágrafo do anúncio (uma medida em resposta às críticas de março, quando não haviam deixado claro o uso da base Kimi)
• 85% de todo o compute foi investido no pipeline próprio de reinforcement learning e no post-training da Cursor, com uso de 25x mais synthetic coding tasks em comparação ao Composer 2
• Para aumentar a confiabilidade em tarefas de longo horizonte, foi introduzido o “RL direcionado com base em feedback textual” — em vez de dar apenas uma recompensa única ao fim de um rollout longo, o sistema injeta dicas diretamente no ponto específico onde ocorreu uma tool call incorreta, refinando a atribuição de crédito
Benchmarks (Composer 2.5 vs Opus 4.7 vs GPT-5.5 vs Composer 2)
• Terminal-Bench 2.0: 69.3% vs 69.4% vs 82.7% vs 61.7% — praticamente empatado com o Opus 4.7, mas cerca de 13 pontos atrás do GPT-5.5
• SWE-Bench Multilingual: 79.8% vs 80.5% vs 77.8% vs 73.7% — diferença de 0.7 ponto para o Opus 4.7, mas à frente do GPT-5.5
• CursorBench v3.1 (default setting): Composer 2.5 63.2%, Opus 4.7 xhigh default 61.6%, GPT-5.5 medium default 59.2% — nas configurações padrão usadas por desenvolvedores reais, supera ambos os modelos de fronteira
Preço — a arma mais poderosa
• Tier Standard: input $0.50/M, output $2.50/M. Tier Fast (padrão interativo): input $3.00/M, output $15.00/M
• No SWE-Bench Multilingual, entrega desempenho no nível do Opus 4.7 por cerca de 1/10 do preço da Anthropic
• No CursorBench, alcança 63% de acurácia com custo médio por tarefa abaixo de $1 — Opus/GPT com desempenho equivalente custam vários dólares a mais por task
O panorama maior anunciado junto
• Separadamente do Composer 2.5, a Cursor também anunciou que está treinando do zero um modelo 10x maior usando cerca de 1 milhão de GPUs classe H100 do Colossus 2, em conjunto com a infraestrutura da xAI (SpaceXAI) (sem data de lançamento definida)
• Segundo o CEO Michael Truell, atualmente 35% dos PRs mergeados dentro da Cursor são gerados por autonomous agents
• Isso soa como um contra-ataque com modelo próprio em um momento em que o Claude Code vinha pressionando a Cursor, após atingir ARR de US$ 2,5 bilhões e ultrapassar 300 mil clientes corporativos
Restrições de uso / comentários
• O Composer 2.5 só pode ser usado no Cursor IDE, Cursor CLI e Cursor Web — não há API externa, mirror no HuggingFace nem gateway de terceiros
• O fato de ser baseado no Kimi K2.5 continua sendo um ponto a considerar em setores regulados ou trabalhos ligados ao governo federal
• É um lançamento que mostra a Cursor, que começou como um “wrapper de IDE”, migrando de fato para um model lab. Como caso de elevar mais de +6 pontos apenas com post-training sobre a mesma base, é um bom dado sobre até onde o vertical RL pode superar raw scale
• Fonte: X (@mntruell), Cursor: Introducing Composer 2.5, OfficeChai
1 comentários
Acabei de testar porque saiu agora, e o Composer 2.5 é bem útil.