2 pontos por princox 2026-02-11 | 1 comentários | Compartilhar no WhatsApp

Há alguns meses, lançamos o Composer 1, nosso primeiro modelo de programação baseado em agentes. Desde então, alcançamos melhorias significativas na capacidade de programação do modelo.

O recém-lançado Composer 1.5 oferece um forte equilíbrio entre velocidade e inteligência para o uso diário. O Composer 1.5 foi construído expandindo em 20 vezes o aprendizado por reforço sobre o mesmo modelo pré-treinado. Os recursos computacionais investidos no pós-treinamento do Composer 1.5 superam em muito a quantidade usada no pré-treinamento do modelo base.

Ao longo dessa expansão, a capacidade de programação continua melhorando de forma consistente. Em medições de benchmark internas baseadas em problemas reais de programação, este modelo superou rapidamente o Composer 1 e continuou apresentando ganhos constantes de desempenho. As melhorias se destacam especialmente em tarefas mais difíceis.

O Composer 1.5 é um modelo de raciocínio. No processo de responder a uma consulta, o modelo gera tokens de raciocínio para inferir sobre a base de código do usuário e planejar os próximos passos. Confirmamos que essas etapas de raciocínio são essenciais para a inteligência do modelo. Ao mesmo tempo, queríamos manter a velocidade e a interatividade do Composer 1.5 para o uso cotidiano. Para equilibrar isso, o modelo foi treinado para responder rapidamente com o mínimo de raciocínio em problemas fáceis e, em problemas difíceis, continuar raciocinando até encontrar uma resposta satisfatória.

Para lidar com tarefas de longa duração, o Composer 1.5 conta com capacidade de auto-resumo. Isso permite que o modelo continue explorando soluções mesmo quando o contexto disponível se esgota. Como parte do aprendizado por reforço (RL), treinamos o Composer 1.5 para produzir seus próprios resumos, solicitando que ele gerasse um resumo útil sempre que o contexto se esgotasse durante o treinamento. Em exemplos difíceis, esse processo pode ocorrer recursivamente várias vezes. Confirmamos que, com o recurso de resumo automático, o modelo consegue manter sua precisão original mesmo com mudanças no comprimento do contexto.

O Composer 1.5 é um modelo muito mais poderoso que o Composer 1 e é recomendado para uso interativo. O processo de treinamento deste modelo demonstra que o RL para programação pode continuar sendo ampliado de forma consistente, com ganhos previsíveis de inteligência.

Os preços podem ser vistos aqui -> https://cursor.com/docs/models

1 comentários

 
leeyeonwoo 2026-02-13

Fico em dúvida se uma empresa que faz ferramentas de IA também consegue fazer IA bem.