12 pontos por recast7838 12 일 전 | 6 comentários | Compartilhar no WhatsApp

A startup chinesa de IA MiniMax lançou de forma impactante o 'M3', um grande modelo multimodal de linguagem baseado em pesos abertos que supera o GPT-5.5 e o Gemini 3.1 Pro com um custo agressivo equivalente a apenas 5% a 10% dos modelos comerciais americanos existentes.


Tradução completa

A startup chinesa de IA MiniMax lançou de forma impactante o 'M3', um grande modelo multimodal de linguagem com desempenho de ponta em programação e uma janela de contexto de 1 milhão de tokens, provocando grande repercussão no mercado global de IA corporativa. O M3 será distribuído nos próximos 10 dias via Hugging Face e GitHub sob uma licença open source de 'pesos abertos (Open Weights)', permitindo que empresas façam o download local em seus próprios servidores e realizem otimizações personalizadas. No momento, ele está sendo oferecido em preço promocional de lançamento a US$ 0,30 por 1 milhão de tokens de entrada e US$ 1,20 por tokens de saída (custo total de US$ 1,50 {b:4}); mesmo quando o preço normal passar a valer, ele continuará custando apenas de 8% a 20% {p:14} dos principais modelos comerciais americanos, superando amplamente gigantes de tecnologia dos EUA como Google, OpenAI e Anthropic no aspecto de custo.

O principal segredo por trás da redução de custo tão dramática do M3 é a arquitetura 'MiniMax Sparse Attention (MSA)', que resolve o problema da explosão do custo computacional quadrático dos transformers tradicionais. A tecnologia MSA divide os dados em blocos de alta precisão e faz o pareamento dinâmico apenas das queries necessárias, maximizando a eficiência de hardware; ao processar 1 milhão de tokens, ela reduz a necessidade computacional para cerca de 1/20 do nível anterior {p:5} e aumenta a velocidade de decodificação em 15 vezes. Com base nessa inovação estrutural, o M3 registrou 59,0% {p:59} no SWE-Bench Pro, que avalia a capacidade de executar engenharia de software autônoma, superando modelos fechados como GPT-5.5 e Gemini 3.1 Pro; também ultrapassou o desempenho anterior do Claude Ops 4.7 em navegação na web e recuperação de informações (BrowseComp 83,5% {p:84}).

Em comparação com o recém-lançado modelo fechado de melhor desempenho, Claude Ops 4.8 (SWE-Bench Pro 69,2% {b:59,69}), ainda existe alguma diferença de desempenho em raciocínio de altíssima dificuldade, mas o M3 oferece uma forte referência para automação local sem exigir assinaturas caras de API. Além disso, a MiniMax apresentou junto a família de agentes 'MiniMax Code', equipada com o M3, capaz de escrever código por conta própria, executar loops independentes de verificação e se autocorrigir, adotando uma política agressiva de preços a partir de US$ 20 por mês (Plus). Em ambientes corporativos nos quais privacidade rigorosa de dados e conformidade regulatória são essenciais, espera-se que a oferta de pesos abertos do M3 elimine na origem o risco de vazamento de dados na nuvem e entregue o melhor custo-benefício para internalizar como ativo central os recursos exclusivos de cada empresa.

Comentário em uma linha do autor

Acho que vou testar isso no Ollama Cloud.

6 comentários

 
somang04 6 일 전

Estou usando o modelo por assinatura da MiniMax e, por US$ 100 por ano... dá para usar de sobra. Inclusive, ainda é possível produzir até 100 faixas de áudio por dia. (Embora às vezes saiam umas músicas estilo country feitas absurdamente em chinês...) Parece uma versão menor do Suno ou do Flow, e acho que serve bem para criar BGM.

Não usei para programação nem para a parte de agentes, mas vou ter que testar e comparar com as APIs da Gemini / OpenAI / Anthropic.

 
jimmy2056 11 일 전

Por ser um modelo chinês, fica complicado usar via API; seria bom se desse para rodar localmente.

 
recast7838 12 일 전

Estou usando agora e, ao contrário de outros modelos chineses, não tem aquele problema de estar escrevendo e de repente sair texto em chinês. Também parece lidar bem com tool call.

 
vndk2234 11 일 전

Como é que o preço sai em nível de GPT nano...
Ao usar IA, a menos que a pessoa envie a própria carteira de identidade, provavelmente não haverá grande problema em usar uma solução chinesa.

 
runableapp 11 일 전

Por ser um modelo chinês, ainda fico um pouco relutante em usar, mas também penso quanto as empresas americanas teriam aumentado os preços dos seus serviços se não existissem esses serviços chineses. Também fico com a suspeita de que isso tenha alguma relação com o fato de Trump ter adotado esse tipo de política.

 
b8g6pn 12 일 전

Talvez o critério para dizer que ele compete de igual para igual com esses modelos seja um pouco exagerado, mas o preço é realmente chocante.