Upstage lança o Solar Pro 2, modelo de raciocínio de nível frontier

(upstage.ai)

7 pontos por GN⁺ 2025-07-14 | 2 comentários | Compartilhar no WhatsApp

Solar Pro 2 é o novo modelo de linguagem frontier da Upstage que, apesar de seu porte compacto de 31B parâmetros, oferece capacidade de raciocínio de próxima geração, versatilidade no uso de diversas ferramentas e desempenho de ponta em coreano e processamento multilíngue dentro da mesma categoria
Em benchmarks principais de coreano (como Ko-Arena-Hard-Auto, Ko-MMLU etc.), apresenta resultados equivalentes ou superiores aos do GPT-4 e Claude 3, além de gerar respostas consistentes e precisas também em domínios especializados como jurídico, finanças e saúde
No modo avançado de raciocínio, consegue lidar com diversas tarefas, como problemas matemáticos, perguntas e respostas lógicas e raciocínio complexo em múltiplas etapas, além de comprovar excelente desempenho também em avaliações de código e engenharia
Conta com arquitetura orientada a agentes para aplicação em trabalho real, além de recursos de integração com ferramentas, geração de arquivos e execução autônoma, permitindo adoção imediata em ambientes corporativos
Um LLM de próxima geração focado em utilidade prática para negócios, com implantação em nuvem e on-premises, reforço de estabilidade e usabilidade, e suporte à adoção empresarial

Desempenho global de nível frontier comprovado: lançamento oficial do Solar Pro 2

Solar Pro 2 é o modelo de linguagem frontier de próxima geração desenvolvido pela Upstage que, apesar do porte compacto de 31B parâmetros, oferece amplo processamento multilíngue, capacidade avançada de raciocínio e uso de ferramentas otimizado para o trabalho prático
Em especial no processamento de coreano, demonstrou desempenho forte o suficiente para competir com GPT-4 e Claude 3, mostrando precisão e consistência também em domínios de alta complexidade, como jurídico, finanças e saúde

Em benchmarks como Ko-Arena-Hard-Auto, alcançou resultados equivalentes aos dos melhores modelos
Em diversas tarefas de NLP em coreano, como Ko-MMLU, Hae-Rae e Ko-IFEval, apresentou desempenho líder em compreensão e geração de linguagem
Também fornece resultados estáveis e precisos em domínios especializados (jurídico, finanças, saúde etc.)

Em um momento em que transparência e explicabilidade do processo de raciocínio são importantes, o Solar Pro 2 vai além da simples previsão e realiza análise, síntese e pensamento em múltiplas etapas
Em benchmarks gerais de raciocínio, como MMLU, MMLU-Pro e HumanEval, o desempenho em tarefas coreanas de múltiplas etapas melhorou significativamente
Também se destaca em problemas matemáticos de alta dificuldade, como Math500 e AIME, e no tratamento de tarefas complexas de desenvolvimento, como SWE-Bench Agentless
Oferece excelente eficiência de raciocínio em relação ao número de parâmetros

O Solar Pro 2 é um LLM orientado a agentes com recursos aplicáveis imediatamente ao trabalho real, como integração com ferramentas, geração de arquivos e execução autônoma de tarefas
Enfatiza que não é apenas um modelo grande, mas uma IA realista que pode ser colocada em operação no trabalho de forma concreta
Exemplo: pode ser aplicado a diversos cenários de automação, como geração automática de relatórios sobre movimentos de concorrentes

idunno 2025-07-15

Seria bom se tivessem mostrado em números o quanto melhorou, o quão excelente é e o quão preciso ficou.

sanxiyn 2025-07-15

No momento em que o Claude 4 já foi lançado, comparar com o Claude 3 não é quase uma fraude...