Resumo dos principais pontos do modelo MiniMax M2
- Visão geral do modelo: o modelo M2 da chinesa MiniMax (230 bilhões de parâmetros, arquitetura de ativação seletiva) apresenta desempenho superior ao Claude Opus 4.1, com custo equivalente a 8% do Claude Sonnet ($0,30 por 1 milhão de tokens de entrada) e velocidade 2x maior.
- Inovação em eficiência: com a arquitetura MoE, apenas os parâmetros necessários são ativados, reduzindo os custos em 92%, com desenvolvimento voltado ao uso prático (resolução de codificação complexa e tarefas de agentes).
- Desempenho em benchmarks: 61 pontos no Intelligence Index (1º entre modelos open source), 69,4 no SWE-bench, 46,3 no Terminal-Bench e 44 no BrowseComp, aproximando-se ou superando modelos Claude e Gemini.
- Aplicação prática: excelente em matemática, programação e fluxos de trabalho com agentes (análise de dados, investigação de issues e programação), com testes de desenvolvedores comprovando sua capacidade de corrigir erros.
- Como usar: uso gratuito via serviço web (https://agent.minimax.io/), integração por API e recomendação de download open source no Hugging Face (licença MIT; certas configurações são obrigatórias).
- Significado: a ascensão dos modelos open source está deslocando a competição em IA para eficiência e utilidade prática.
3 comentários
Se for 23B (no texto é 230B), achei por um instante que talvez desse até para rodar num mac mini..
Eu também... como disseram que o 23B era do nível do Claude 4.1 Opus, fui ao Hugging Face, mas fiquei decepcionado porque era 230B.....
Não são 23 bilhões, e sim 230 bilhões de parâmetros.