- Modelo de linguagem Mamba2 especializado em geração de código
- Os modelos Mamba, ao contrário dos modelos Transformer, oferecem inferência em tempo linear e a capacidade de modelar sequências de comprimento teoricamente infinito
- Isso permite que os usuários interajam extensivamente com o modelo com respostas rápidas, independentemente do tamanho da entrada
- Essa eficiência impacta especialmente a produtividade em código, permitindo desempenho equivalente a modelos SOTA baseados em Transformer
- Nos resultados de benchmark do modelo 7B, o Codestral Mamba (7B) mostrou desempenho superior ou quase equivalente em relação ao CodeGemma-1.1 7B, CodeLlama 7B e DeepSeek v1.5 7B
- Espera-se que se torne um excelente assistente de código local
- Pode ser implantado via SDK
mistral-inference e TensorRT-LLM, e também deverá receber suporte no llama.cpp para inferência local
- Download dos pesos brutos disponível no HuggingFace
2 comentários
Comentários do Hacker News
São necessários passos para executar no VS Code
Pede recomendações de modelos com recurso FIM
codellama-13bcom uma extensão do vim, mas o desempenho não é muito bomGemma-27bgera código melhor, mas não tem recurso FIMcodellama-34bnão faz inferência corretamenteO DeepSeek deveria ser destacado na coluna MBPP
Anunciaram que o modelo está no HuggingFace, mas não forneceram o link
É bom ver um modelo de alto perfil usando Mamba2
Dizem que o Mamba é mais rápido, mas não há números de latência
Recomenda uma apresentação de produto sobre os prós e contras de Mamba e Transformers
Pergunta se existe uma boa explicação sobre a arquitetura Mamba
Recomenda vídeos ou textos para alguém que entende o conceito geral de LLM, mas só usou ferramentas publicamente disponíveis como ChatGPT, Claude etc.
Fez um teste rápido no playground do model.box
gpt-4o)Codestral - o modelo de IA para geração de código da Mistral