Lançamento do Mistral Small 3

(mistral.ai)

5 pontos por GN⁺ 2025-01-31 | 1 comentários | Compartilhar no WhatsApp

A equipe da Mistral AI lançou o Mistral Small 3, um modelo de 24 bilhões de parâmetros, sob a licença Apache 2.0.
O modelo pode competir com modelos maiores, como Llama 3.3 70B e Qwen 32B, e é uma boa alternativa a modelos proprietários como o GPT4o-mini.
O Mistral Small 3 foi projetado com um tamanho adequado para implantação local, e seu menor número de camadas reduz o tempo de processamento.
Apresenta mais de 81% de precisão no MMLU e latência de 150 tokens/s.

Desempenho

Avaliação humana

Foram avaliados mais de 1.000 conjuntos de prompts de programação e gerais com uma empresa externa de avaliação.
A preferência foi analisada comparando as respostas do Mistral Small 3 com as de outros modelos.
Houve cuidado para garantir uma avaliação justa, e há confiança na validade dos benchmarks.

Desempenho em instruções

O modelo ajustado para instruções apresenta desempenho competitivo em relação a modelos abertos com o triplo do tamanho e ao modelo GPT4o-mini.
Registrou alta precisão em benchmarks de código, matemática, conhecimento geral e execução de instruções.

Desempenho de pré-treinamento

O Mistral Small 3 é um modelo de 24B que oferece desempenho líder para seu porte e compete com modelos três vezes maiores, como o Llama 3.3 70B.

Casos de uso do Mistral Small 3

Suporte conversacional com resposta rápida: entrega ótimo desempenho em cenários em que respostas rápidas e precisas são essenciais.
Chamadas de função com baixa latência: pode lidar com execução rápida de funções em fluxos de trabalho automatizados.
Criação de especialistas em áreas específicas: pode ser refinado para domínios específicos, gerando especialistas altamente precisos.
Inferência local: útil para pessoas ou organizações que lidam com informações sensíveis.

Uso do Mistral Small 3 na sua stack de tecnologia preferida

O Mistral Small 3 está disponível no la Plateforme como mistral-small-latest ou mistral-small-2501.
Em parceria com Hugging Face, Ollama, Kaggle, Together AI e Fireworks AI, o modelo é oferecido em várias plataformas.

Próximos passos

O Mistral Small 3 complementa grandes modelos open source de raciocínio, como o DeepSeek, e pode servir como uma base sólida para fortalecer capacidades de raciocínio.
Modelos menores e maiores serão lançados futuramente.

Modelos open source da Mistral

A empresa planeja oferecer modelos de propósito geral sob a licença Apache 2.0.
Os pesos do modelo podem ser baixados e implantados localmente, com liberdade para modificação e uso.
Também serão disponibilizados por meio de API serverless, implantações on-premises e em VPC, além de plataforma de customização e orquestração.

1 comentários

GN⁺ 2025-01-31

Comentários do Hacker News

O modelo Mistral Small tem como objetivo ser o modelo ideal para rodar em notebooks com desempenho razoável, e está sendo comparado ao Llama 3.3 70B e ao Qwen 2.5 32B
- Está sendo executado em um MacBook Pro M2 com 64 GB via Ollama, e é rápido e tem ótimo desempenho
- É necessário baixar 14 GB de pesos do modelo
Tom, da Epoch AI, está construindo uma infraestrutura para realizar avaliações de LLMs de forma sistemática e em grande escala
- As avaliações são feitas usando a biblioteca Inspect do governo do Reino Unido
- O Mistral Small 3 foi avaliado no MATH nível 5 e obteve acurácia de 0,45
- A acurácia média foi medida com 8 amostragens para cada uma das 1.324 perguntas
Está migrando para a licença Apache 2.0, deixando a licença não comercial para trás
Ao testar prompts de geração de código, apresentou desempenho semelhante ao qwen2.5-coder-32b
- É impressionante que modelos pequenos estejam produzindo saídas mais sofisticadas
- Há expectativa por uma nova versão do modelo mixtral 8x7B
Os principais pontos desta versão são os seguintes
- Aplicação da licença Apache 2.0
- Baixa latência (11 ms/token)
- Desempenho entre o Qwen 2.5 32B e o Llama 3.3 70B
- O modelo Mistral Small roda a uma velocidade de 9 tokens/segundo
Com os lançamentos recentes de modelos MoE, 24 GB de VRAM parecem insuficientes
- O Mistral Small 3 não usa RL nem dados sintéticos
O modelo Mistral Small respondeu corretamente à pergunta sobre o primeiro álbum de Mary J Blige
Há curiosidade sobre o motivo de usar modelos pequenos
Há uma opinião de que seria bom incluir a quantidade de parâmetros no nome do modelo

Lançamento do Mistral Small 3

Desempenho

Avaliação humana

Desempenho em instruções

Desempenho de pré-treinamento

Casos de uso do Mistral Small 3

Uso do Mistral Small 3 na sua stack de tecnologia preferida

Próximos passos

Modelos open source da Mistral

Leituras relacionadas

1 comentários

Comentários do Hacker News