5 pontos por GN⁺ 2025-01-31 | 1 comentários | Compartilhar no WhatsApp
  • A equipe da Mistral AI lançou o Mistral Small 3, um modelo de 24 bilhões de parâmetros, sob a licença Apache 2.0.
  • O modelo pode competir com modelos maiores, como Llama 3.3 70B e Qwen 32B, e é uma boa alternativa a modelos proprietários como o GPT4o-mini.
  • O Mistral Small 3 foi projetado com um tamanho adequado para implantação local, e seu menor número de camadas reduz o tempo de processamento.
  • Apresenta mais de 81% de precisão no MMLU e latência de 150 tokens/s.

Desempenho

Avaliação humana

  • Foram avaliados mais de 1.000 conjuntos de prompts de programação e gerais com uma empresa externa de avaliação.
  • A preferência foi analisada comparando as respostas do Mistral Small 3 com as de outros modelos.
  • Houve cuidado para garantir uma avaliação justa, e há confiança na validade dos benchmarks.

Desempenho em instruções

  • O modelo ajustado para instruções apresenta desempenho competitivo em relação a modelos abertos com o triplo do tamanho e ao modelo GPT4o-mini.
  • Registrou alta precisão em benchmarks de código, matemática, conhecimento geral e execução de instruções.

Desempenho de pré-treinamento

  • O Mistral Small 3 é um modelo de 24B que oferece desempenho líder para seu porte e compete com modelos três vezes maiores, como o Llama 3.3 70B.

Casos de uso do Mistral Small 3

  • Suporte conversacional com resposta rápida: entrega ótimo desempenho em cenários em que respostas rápidas e precisas são essenciais.
  • Chamadas de função com baixa latência: pode lidar com execução rápida de funções em fluxos de trabalho automatizados.
  • Criação de especialistas em áreas específicas: pode ser refinado para domínios específicos, gerando especialistas altamente precisos.
  • Inferência local: útil para pessoas ou organizações que lidam com informações sensíveis.

Uso do Mistral Small 3 na sua stack de tecnologia preferida

  • O Mistral Small 3 está disponível no la Plateforme como mistral-small-latest ou mistral-small-2501.
  • Em parceria com Hugging Face, Ollama, Kaggle, Together AI e Fireworks AI, o modelo é oferecido em várias plataformas.

Próximos passos

  • O Mistral Small 3 complementa grandes modelos open source de raciocínio, como o DeepSeek, e pode servir como uma base sólida para fortalecer capacidades de raciocínio.
  • Modelos menores e maiores serão lançados futuramente.

Modelos open source da Mistral

  • A empresa planeja oferecer modelos de propósito geral sob a licença Apache 2.0.
  • Os pesos do modelo podem ser baixados e implantados localmente, com liberdade para modificação e uso.
  • Também serão disponibilizados por meio de API serverless, implantações on-premises e em VPC, além de plataforma de customização e orquestração.

1 comentários

 
GN⁺ 2025-01-31
Comentários do Hacker News
  • O modelo Mistral Small tem como objetivo ser o modelo ideal para rodar em notebooks com desempenho razoável, e está sendo comparado ao Llama 3.3 70B e ao Qwen 2.5 32B

    • Está sendo executado em um MacBook Pro M2 com 64 GB via Ollama, e é rápido e tem ótimo desempenho
    • É necessário baixar 14 GB de pesos do modelo
  • Tom, da Epoch AI, está construindo uma infraestrutura para realizar avaliações de LLMs de forma sistemática e em grande escala

    • As avaliações são feitas usando a biblioteca Inspect do governo do Reino Unido
    • O Mistral Small 3 foi avaliado no MATH nível 5 e obteve acurácia de 0,45
    • A acurácia média foi medida com 8 amostragens para cada uma das 1.324 perguntas
  • Está migrando para a licença Apache 2.0, deixando a licença não comercial para trás

  • Ao testar prompts de geração de código, apresentou desempenho semelhante ao qwen2.5-coder-32b

    • É impressionante que modelos pequenos estejam produzindo saídas mais sofisticadas
    • Há expectativa por uma nova versão do modelo mixtral 8x7B
  • Os principais pontos desta versão são os seguintes

    • Aplicação da licença Apache 2.0
    • Baixa latência (11 ms/token)
    • Desempenho entre o Qwen 2.5 32B e o Llama 3.3 70B
    • O modelo Mistral Small roda a uma velocidade de 9 tokens/segundo
  • Com os lançamentos recentes de modelos MoE, 24 GB de VRAM parecem insuficientes

    • O Mistral Small 3 não usa RL nem dados sintéticos
  • O modelo Mistral Small respondeu corretamente à pergunta sobre o primeiro álbum de Mary J Blige

  • Há curiosidade sobre o motivo de usar modelos pequenos

  • Há uma opinião de que seria bom incluir a quantidade de parâmetros no nome do modelo