1 pontos por recast7838 3 시간 전 | 2 comentários | Compartilhar no WhatsApp

A startup chinesa de IA MiniMax lançou de forma impactante o 'M3', um grande modelo multimodal de linguagem baseado em pesos abertos que supera o GPT-5.5 e o Gemini 3.1 Pro com um custo agressivo equivalente a apenas 5% a 10% dos modelos comerciais americanos existentes.


Tradução completa

A startup chinesa de IA MiniMax lançou de forma impactante o 'M3', um grande modelo multimodal de linguagem com desempenho de ponta em programação e uma janela de contexto de 1 milhão de tokens, provocando grande repercussão no mercado global de IA corporativa. O M3 será distribuído nos próximos 10 dias via Hugging Face e GitHub sob uma licença open source de 'pesos abertos (Open Weights)', permitindo que empresas façam o download local em seus próprios servidores e realizem otimizações personalizadas. No momento, ele está sendo oferecido em preço promocional de lançamento a US$ 0,30 por 1 milhão de tokens de entrada e US$ 1,20 por tokens de saída (custo total de US$ 1,50 {b:4}); mesmo quando o preço normal passar a valer, ele continuará custando apenas de 8% a 20% {p:14} dos principais modelos comerciais americanos, superando amplamente gigantes de tecnologia dos EUA como Google, OpenAI e Anthropic no aspecto de custo.

O principal segredo por trás da redução de custo tão dramática do M3 é a arquitetura 'MiniMax Sparse Attention (MSA)', que resolve o problema da explosão do custo computacional quadrático dos transformers tradicionais. A tecnologia MSA divide os dados em blocos de alta precisão e faz o pareamento dinâmico apenas das queries necessárias, maximizando a eficiência de hardware; ao processar 1 milhão de tokens, ela reduz a necessidade computacional para cerca de 1/20 do nível anterior {p:5} e aumenta a velocidade de decodificação em 15 vezes. Com base nessa inovação estrutural, o M3 registrou 59,0% {p:59} no SWE-Bench Pro, que avalia a capacidade de executar engenharia de software autônoma, superando modelos fechados como GPT-5.5 e Gemini 3.1 Pro; também ultrapassou o desempenho anterior do Claude Ops 4.7 em navegação na web e recuperação de informações (BrowseComp 83,5% {p:84}).

Em comparação com o recém-lançado modelo fechado de melhor desempenho, Claude Ops 4.8 (SWE-Bench Pro 69,2% {b:59,69}), ainda existe alguma diferença de desempenho em raciocínio de altíssima dificuldade, mas o M3 oferece uma forte referência para automação local sem exigir assinaturas caras de API. Além disso, a MiniMax apresentou junto a família de agentes 'MiniMax Code', equipada com o M3, capaz de escrever código por conta própria, executar loops independentes de verificação e se autocorrigir, adotando uma política agressiva de preços a partir de US$ 20 por mês (Plus). Em ambientes corporativos nos quais privacidade rigorosa de dados e conformidade regulatória são essenciais, espera-se que a oferta de pesos abertos do M3 elimine na origem o risco de vazamento de dados na nuvem e entregue o melhor custo-benefício para internalizar como ativo central os recursos exclusivos de cada empresa.

Comentário em uma linha do autor

Acho que vou testar isso no Ollama Cloud.

2 comentários

 
b8g6pn 3 시간 전

Talvez o critério para dizer que ele compete de igual para igual com esses modelos seja um pouco exagerado, mas o preço é realmente chocante.

 
recast7838 3 시간 전

Estou usando agora e, ao contrário de outros modelos chineses, não tem aquele problema de estar escrevendo e de repente sair texto em chinês. Também parece lidar bem com tool call.