MiniMax-M3 estreia, supera GPT-5.5 e Gemini 3.1 Pro em benchmarks-chave com custo de apenas 5% a 10%
(venturebeat.com)A startup chinesa de IA MiniMax lançou de forma impactante o 'M3', um grande modelo multimodal de linguagem baseado em pesos abertos que supera o GPT-5.5 e o Gemini 3.1 Pro com um custo agressivo equivalente a apenas 5% a 10% dos modelos comerciais americanos existentes.
Tradução completa
A startup chinesa de IA MiniMax lançou de forma impactante o 'M3', um grande modelo multimodal de linguagem com desempenho de ponta em programação e uma janela de contexto de 1 milhão de tokens, provocando grande repercussão no mercado global de IA corporativa. O M3 será distribuído nos próximos 10 dias via Hugging Face e GitHub sob uma licença open source de 'pesos abertos (Open Weights)', permitindo que empresas façam o download local em seus próprios servidores e realizem otimizações personalizadas. No momento, ele está sendo oferecido em preço promocional de lançamento a US$ 0,30 por 1 milhão de tokens de entrada e US$ 1,20 por tokens de saída (custo total de US$ 1,50 ); mesmo quando o preço normal passar a valer, ele continuará custando apenas de 8% a 20% {p:14} dos principais modelos comerciais americanos, superando amplamente gigantes de tecnologia dos EUA como Google, OpenAI e Anthropic no aspecto de custo.
O principal segredo por trás da redução de custo tão dramática do M3 é a arquitetura 'MiniMax Sparse Attention (MSA)', que resolve o problema da explosão do custo computacional quadrático dos transformers tradicionais. A tecnologia MSA divide os dados em blocos de alta precisão e faz o pareamento dinâmico apenas das queries necessárias, maximizando a eficiência de hardware; ao processar 1 milhão de tokens, ela reduz a necessidade computacional para cerca de 1/20 do nível anterior {p:5} e aumenta a velocidade de decodificação em 15 vezes. Com base nessa inovação estrutural, o M3 registrou 59,0% {p:59} no SWE-Bench Pro, que avalia a capacidade de executar engenharia de software autônoma, superando modelos fechados como GPT-5.5 e Gemini 3.1 Pro; também ultrapassou o desempenho anterior do Claude Ops 4.7 em navegação na web e recuperação de informações (BrowseComp 83,5% {p:84}).
Em comparação com o recém-lançado modelo fechado de melhor desempenho, Claude Ops 4.8 (SWE-Bench Pro 69,2% ), ainda existe alguma diferença de desempenho em raciocínio de altíssima dificuldade, mas o M3 oferece uma forte referência para automação local sem exigir assinaturas caras de API. Além disso, a MiniMax apresentou junto a família de agentes 'MiniMax Code', equipada com o M3, capaz de escrever código por conta própria, executar loops independentes de verificação e se autocorrigir, adotando uma política agressiva de preços a partir de US$ 20 por mês (Plus). Em ambientes corporativos nos quais privacidade rigorosa de dados e conformidade regulatória são essenciais, espera-se que a oferta de pesos abertos do M3 elimine na origem o risco de vazamento de dados na nuvem e entregue o melhor custo-benefício para internalizar como ativo central os recursos exclusivos de cada empresa.
Comentário em uma linha do autor
Acho que vou testar isso no Ollama Cloud.
2 comentários
Talvez o critério para dizer que ele compete de igual para igual com esses modelos seja um pouco exagerado, mas o preço é realmente chocante.
Estou usando agora e, ao contrário de outros modelos chineses, não tem aquele problema de estar escrevendo e de repente sair texto em chinês. Também parece lidar bem com
tool call.