7 pontos por GN⁺ 2025-07-14 | 2 comentários | Compartilhar no WhatsApp
  • Solar Pro 2 é o novo modelo de linguagem frontier da Upstage que, apesar de seu porte compacto de 31B parâmetros, oferece capacidade de raciocínio de próxima geração, versatilidade no uso de diversas ferramentas e desempenho de ponta em coreano e processamento multilíngue dentro da mesma categoria
  • Em benchmarks principais de coreano (como Ko-Arena-Hard-Auto, Ko-MMLU etc.), apresenta resultados equivalentes ou superiores aos do GPT-4 e Claude 3, além de gerar respostas consistentes e precisas também em domínios especializados como jurídico, finanças e saúde
  • No modo avançado de raciocínio, consegue lidar com diversas tarefas, como problemas matemáticos, perguntas e respostas lógicas e raciocínio complexo em múltiplas etapas, além de comprovar excelente desempenho também em avaliações de código e engenharia
  • Conta com arquitetura orientada a agentes para aplicação em trabalho real, além de recursos de integração com ferramentas, geração de arquivos e execução autônoma, permitindo adoção imediata em ambientes corporativos
  • Um LLM de próxima geração focado em utilidade prática para negócios, com implantação em nuvem e on-premises, reforço de estabilidade e usabilidade, e suporte à adoção empresarial

Desempenho global de nível frontier comprovado: lançamento oficial do Solar Pro 2

  • Solar Pro 2 é o modelo de linguagem frontier de próxima geração desenvolvido pela Upstage que, apesar do porte compacto de 31B parâmetros, oferece amplo processamento multilíngue, capacidade avançada de raciocínio e uso de ferramentas otimizado para o trabalho prático
  • Em especial no processamento de coreano, demonstrou desempenho forte o suficiente para competir com GPT-4 e Claude 3, mostrando precisão e consistência também em domínios de alta complexidade, como jurídico, finanças e saúde

Desempenho de processamento de coreano entre os melhores da categoria

  • Em benchmarks como Ko-Arena-Hard-Auto, alcançou resultados equivalentes aos dos melhores modelos
  • Em diversas tarefas de NLP em coreano, como Ko-MMLU, Hae-Rae e Ko-IFEval, apresentou desempenho líder em compreensão e geração de linguagem
  • Também fornece resultados estáveis e precisos em domínios especializados (jurídico, finanças, saúde etc.)

Capacidade de raciocínio evoluída

  • Em um momento em que transparência e explicabilidade do processo de raciocínio são importantes, o Solar Pro 2 vai além da simples previsão e realiza análise, síntese e pensamento em múltiplas etapas
  • Em benchmarks gerais de raciocínio, como MMLU, MMLU-Pro e HumanEval, o desempenho em tarefas coreanas de múltiplas etapas melhorou significativamente
  • Também se destaca em problemas matemáticos de alta dificuldade, como Math500 e AIME, e no tratamento de tarefas complexas de desenvolvimento, como SWE-Bench Agentless
  • Oferece excelente eficiência de raciocínio em relação ao número de parâmetros

Um LLM orientado a agentes que move o trabalho prático

  • O Solar Pro 2 é um LLM orientado a agentes com recursos aplicáveis imediatamente ao trabalho real, como integração com ferramentas, geração de arquivos e execução autônoma de tarefas
  • Enfatiza que não é apenas um modelo grande, mas uma IA realista que pode ser colocada em operação no trabalho de forma concreta
  • Exemplo: pode ser aplicado a diversos cenários de automação, como geração automática de relatórios sobre movimentos de concorrentes

2 comentários

 
idunno 2025-07-15

Seria bom se tivessem mostrado em números o quanto melhorou, o quão excelente é e o quão preciso ficou.

 
sanxiyn 2025-07-15

No momento em que o Claude 4 já foi lançado, comparar com o Claude 3 não é quase uma fraude...