- Magistral é o primeiro modelo de raciocínio da Mistral AI, especializado em domínios específicos, transparência e raciocínio multilíngue
- Lançado em duas versões: o open source Magistral Small (24B de parâmetros) e a versão enterprise Magistral Medium
- Fornece raciocínio multilíngue baseado em Chain of Thought, mostrando de forma transparente o processo lógico passo a passo no idioma do usuário
- No AIME2024, o Magistral Medium alcançou 73,6% (máximo de 90%) e o Small 70,7% (máximo de 83,3%)
- Oferece encadeamento lógico preciso passo a passo e velocidade de resposta 10x maior para diferentes idiomas e setores, como jurídico, finanças, saúde, engenharia de dados, desenvolvimento de software e conteúdo criativo
Magistral — anúncio do primeiro modelo de raciocínio da Mistral AI
- O Magistral é um modelo de reasoning focado em capacidade de resolver problemas do mundo real e melhoria baseada em feedback
- O Magistral Small é a versão open source com 24B de parâmetros, enquanto o Magistral Medium é uma versão enterprise mais poderosa; os dois foram lançados em paralelo
- Métricas de desempenho:
- Magistral Medium: 73,6% no AIME2024, chegando a 90% com votação por maioria
- Magistral Small: 70,7% e 83,3%, respectivamente
- Aplica raciocínio Chain of Thought com base em idiomas e sistemas de escrita globais, permitindo desenvolver o pensamento em nível de língua nativa
- Adequado para tarefas como cálculo estruturado, lógica de programação, árvores de decisão e sistemas baseados em regras
- Com os recursos Think mode e Flash Answers do Le Chat, melhora a velocidade de resposta em 10x em relação aos concorrentes
- O artigo oficial inclui uma avaliação abrangente de algoritmos, infraestrutura de treinamento, técnicas de reinforcement learning e insights de treinamento
Modelos e detalhes técnicos
- Processo de raciocínio transparente:
- O Magistral é otimizado para lógica em múltiplas etapas, permitindo que o usuário veja e acompanhe o processo de raciocínio no próprio idioma
- Diferentemente de modelos gerais, reforça a interpretabilidade e os recursos de verificação
- O objetivo é permitir atualizações contínuas do modelo e melhorias rápidas
- Raciocínio multilíngue: alta precisão e manutenção da lógica em inglês, francês, espanhol, alemão, italiano, árabe, russo, chinês e outros idiomas
- Velocidade de resposta:
- O Magistral Medium oferece raciocínio e feedback em tempo real por meio do recurso Flash Answers do Le Chat, com velocidade de processamento de tokens 10x maior que a dos concorrentes
- Demonstrou excelência em velocidade em comparação com modelos concorrentes importantes, como o ChatGPT
Open source e participação da comunidade
- O Magistral Small foi lançado sob a licença Apache 2.0
- Os usuários podem analisar, modificar e reestruturar diretamente sua arquitetura e seu método de raciocínio
- Modelos open source anteriores foram usados em projetos de pesquisa inovadores como ether0 e DeepHermes 3
Casos de uso amplos
- O Magistral é otimizado para áreas em que raciocínio preciso passo a passo e transparência são essenciais, como jurídico, finanças, desenvolvimento de software e storytelling
-
Estratégia e operações de negócios
- Pode executar planejamento estratégico, avaliação de riscos, tomada de decisão orientada por dados e cálculo de soluções ótimas sob restrições complexas
-
Setores regulados e setor público
- Profissionais de direito, finanças, saúde e governo podem rastrear caminhos de raciocínio lógico e garantir auditabilidade
- Ajuda a atender requisitos de auditabilidade e conformidade regulatória
-
Sistemas, software e engenharia de dados
- Melhora a qualidade do suporte em programação, design de projetos, arquitetura backend e engenharia de dados em comparação com LLMs sem raciocínio
- É eficaz em tarefas de múltiplas etapas, como integração com ferramentas externas e APIs
-
Geração de conteúdo e comunicação
- O Magistral também apresenta excelentes resultados em escrita criativa e storytelling
- Além de texto consistente, também consegue gerar ideias únicas e criativas
Como usar e canais de disponibilização
- A versão Small pode ser baixada e implantada por conta própria
- A versão Medium pode ser usada imediatamente no Le Chat (web), API e Amazon SageMaker
- Em breve haverá suporte adicional no IBM WatsonX, Azure AI e Google Cloud Marketplace
- Implantações personalizadas para empresas e on-premises mediante contato separado
1 comentários
Comentários do Hacker News
ollama run hf.co/unsloth/Magistral-Small-2506-GGUF:UD-Q4_K_XL, e no llama.cpp a recomendação é usar obrigatoriamente opções como--jinja,--temp 0.7e--top-p 0.95. Também é recomendado aumentar o comprimento de contexto do Ollama para mais de 8192, e há mais orientações na documentação oficialjinja-e depois espaço, isso às vezes vira um travessão curto, então a pessoa corrige manualmente para evitar mal-entendidos