Notas do Mistral AI Now Summit
(koenvangilst.nl)- A Mistral está se posicionando para ir além de uma simples empresa de modelos e se tornar uma companhia de IA full stack, reunindo computação, modelos, plataforma e consultoria
- Com um data center de 40 MW em Paris e planos para data centers adicionais, a empresa se diferencia com modelos abertos e personalizados que os clientes podem possuir e executar on-premises
- Em vez de anunciar novos modelos, o foco esteve em parcerias, com destaque para colaborações com ASML, BNP Paribas e Amazon Alexa+, além da apresentação do Vibe for Work
- Em sistemas de agentes, o harness adiciona contexto, persistência e aprendizado, enquanto o raciocínio é tratado como essencial para recuperação de erros e manutenção da transparência
- Modelos pequenos e especializados, junto com implantação on-premises, formam uma estratégia voltada a setores regulados e empresas europeias, com foco em retorno prático sobre investimento, e não na corrida por AGI
Posicionamento da Mistral
- A Mistral está se movendo para além de uma empresa de modelos, em direção à construção de uma stack completa de IA, incluindo computação, modelos, plataforma e consultoria
- A empresa possui um data center de 40 MW em Paris e também planeja data centers adicionais, incluindo na Suécia
- O diferencial em relação a Anthropic ou OpenAI é oferecer modelos eficientes, abertos e personalizáveis, que os clientes podem possuir e executar on-premises
- A mensagem do evento deu mais peso a parcerias do que a novos modelos ou inovações tecnológicas
- As colaborações com ASML, BNP Paribas e Amazon Alexa+ foram apresentadas como exemplos de uso de IA para resolver problemas reais
- Vibe for Work foi apresentado como um produto semelhante ao Claude for Work
Estratégia de produto e casos de uso
-
Sistemas de agentes e harness
- Só o modelo não é suficiente, e o harness tem o papel de adicionar contexto, persistência e aprendizado
- O raciocínio (reasoning) é tratado como um elemento central para permitir que o sistema volte atrás, se recupere de erros e mantenha a transparência
- As boas práticas da organização são capturadas como skills e evoluem no processo de trabalho com agentes de IA
-
Modelos pequenos e especializados
- A Mistral apresenta casos em que modelos pequenos, rápidos e bem focados superam grandes modelos de uso geral em eficiência energética e velocidade
- Document AI é um modelo para OCR, usado pelo EU Patent Office em OCR em larga escala
- Voxtral é um modelo de voz multilíngue, usado para operar o Amazon Alexa+ na Europa
- Robostral é usado em robótica industrial com a ASML
- Em aplicações baseadas em agentes com alto consumo de tokens, velocidade e eficiência se tornam tão importantes quanto o desempenho bruto
-
Soberania e implantação on-premises
- O BNP Paribas executa modelos da Mistral on-premises na Bélgica para casos de uso de KYC, mantendo dados sensíveis dentro do banco
- A Abanca usa orquestração de agentes para processar em escala informações sensíveis de mais de 1 milhão de clientes no app
- Para empresas europeias em setores regulados, isso pode ser uma alternativa para reduzir a dependência de hyperscalers dos EUA
-
Aplicações em humanidades
- Uma equipe de pesquisa da Austrian Academy of Sciences fez fine-tuning do LLM de código da Mistral, o Codestral, para ler fragmentos de papiro com milhares de anos
- Esse trabalho ajuda a tornar acessível uma coleção de 180 mil documentos encontrados no deserto egípcio
- Foi apresentado como uma tarefa que teria levado mais de 2.000 anos sem IA
- O projeto Apollo da Austrian Academy of Sciences é um exemplo de como a IA também pode contribuir para as humanidades
-
Estratégia de parceira europeia de IA
- A visão da Mistral está mais próxima de se tornar uma parceira europeia full stack de IA que entregue retorno real sobre investimento agora, do que de vencer a corrida por AGI
- O sucesso dessa estratégia depende de mais empresas europeias adotarem a abordagem da Mistral
- A combinação de modelos abertos, implantação on-premises e parcerias empresariais pode ser atraente para muitas grandes organizações da UE
- A era da dependência cega das big techs dos EUA está chegando ao fim, e o importante é que surgiu um player europeu de IA para ser levado a sério
Quer continuar recebendo tópicos de tecnologia selecionados?
Siga o canal no Telegram. @GeekNewsBrasil
1 comentários
Comentários do Hacker News
Torço muito pela Mistral e pelos modelos pequenos especializados em tarefas, mas a Mistral ficou para trás demais desde o terceiro trimestre de 2025
Para competir agora, é preciso conseguir rodar bons modelos de raciocínio mesmo com um comprimento de contexto intermediário, e a Mistral aparentemente não consegue fazer isso
No momento, entre os modelos pequenos, Gemma4 e Qwen3.6 são os melhores, e o modelo “small” da Mistral tem 120B, cerca de 4 vezes mais parâmetros, e ainda assim não consegue competir direito nem com modelos de um quarto do tamanho
Há um ano, na época do Mistral Small 3.1, eles ainda estavam acompanhando, mas agora quase desapareceram do radar
Se a Mistral quer mirar seriamente o mercado on-premises e de modelos pequenos especializados em tarefas, criar um modelo que empolgue o pessoal do r/localLlama pode ser um indicador indireto bem útil
Também é preocupante que quase não tenham falado de modelos novos na conferência. Pessoalmente, acho que essa deveria ser a maior prioridade deles
Fico curioso sobre o que está travando isso. Não sei se é dinheiro, recursos computacionais, capacidade, dados de treinamento ou outra coisa
Para fazer um modelo realmente bom, talvez seja preciso treinar com dados bem questionáveis, como saídas de modelos de ponta, e tenho receio de que a Mistral seja europeia e voltada demais para clientes corporativos para assumir esse tipo de risco
No fim, provavelmente vai virar uma empresa zumbi como a Dailymotion
Por exemplo, penso em algo como um subconjunto do Opus voltado só para software, usado como padrão no Claude Code
Seria menor, mais barato de implantar e usar, e talvez até mais rápido
A Mistral precisa estar pronta para esse momento, mas olhando para os resultados recentes, realisticamente não dá para ter muita expectativa
Como o Mistral 4 tem 6B de parâmetros ativos por token, mesmo supondo que dê para colocar de 3 a 3,5 parâmetros por token numa 4090, algo como 240GB de download e armazenamento já fica perto do limite do que é viável para testar localmente
Isso vale ainda mais quando se está baixando vários modelos para avaliar, e também dificulta que outras pessoas criem fine-tunings depois, como acontecia com os antigos modelos Mistral/Magistral
Ouvi a palestra de um excelente responsável de TI do governo, que está avaliando modelos e estava bastante insatisfeito com a situação atual
Ele quer usar a Mistral e, em alguns casos, ela é até o único modelo baseado na UE que pode ser usado, mas também sabe que o desempenho é realmente ruim e está ficando cada vez mais atrás
Talvez a Mistral ainda consiga construir um negócio lucrativo por ser o único modelo viável para certos usos na UE, mesmo sendo pior. É triste, e doloroso de ver
Eu realmente queria que a Europa participasse do desenvolvimento e da pesquisa em IA, e torci muito pela Mistral
Mas a defasagem tecnológica está se acumulando demais. Se isso não for corrigido, será mais uma prova de que a Europa não consegue operar grandes empresas de tecnologia com bons resultados
Na prática, quase todos os laboratórios chineses estão indo muito melhor. Nem precisa falar da DeepSeek; quem fez coisas como MiMo 2.5 e Minimax 2.7 não foi a Mistral
Os modelos da Mistral são mais fracos, ou maiores e mais lentos, ou então não têm mistura de especialistas (MoE), então a situação não é boa
A Europa deu um tiro no próprio pé com essa lei, feita às pressas no auge da histeria pública, e agora nenhuma empresa minimamente sensata vai querer construir algo ali
Uma startup de IA nos EUA ou na China pode começar com um garoto e um computador, mas na Europa esse garoto precisa de doze advogados
O fato de a Mistral estar perdendo relevância apesar da vantagem inicial, dos primeiros modelos muito promissores e do investimento que recebeu pode ser consequência de ter tentado cumprir toda essa regulação
Fiquei muito impressionado com aquele relatório técnico. Claro, pelo que sei, a ideia de MoE em si já existia antes
Se tivessem levado a família Mixtral mais adiante, talvez hoje tivessem uma reputação parecida com a da linha Qwen. Foi uma oportunidade perdida
Comparado a isso, acho que a Europa até está indo relativamente bem
O BNP Paribas está operando modelos da Mistral on-premises na Bélgica para KYC, e o importante é que os dados sensíveis permaneçam dentro do banco
A Abanca também está usando orquestração de agentes para processar grandes volumes de informações sensíveis de clientes, como os 2 milhões de clientes do app
Para empresas europeias de setores regulados, isso é uma alternativa melhor do que depender de hyperscalers dos EUA, e o fato de a Mistral focar em modelos on-premises e hospedados na Europa parece uma direção muito inteligente
Todo mundo está fazendo engenharia de implantação completa ou engenharia sob medida para clientes, porque, sem isso, a empresa passa a impressão de apenas adicionar margem em cima do custo de tokens
Aí as empresas Neo-SaaS é que vão ficar com o dinheiro. Fora isso, quem compraria a IA da Mistral, e que outras opções haveria
Em vez disso, parece estar se concentrando em outras áreas, como modelos multilíngues, OCR e voz
A página de apresentação dos modelos também mostra isso, mas é tudo tão variado, com tantas categorias e nomes de modelos, que sempre me confundo
Espero que as decisões deles deem bons resultados
Para startups europeias, B2B corporativo sempre me pareceu um lugar para ir morrer
Estive no evento, e o tamanho do público foi impressionante; todos os líderes das principais empresas europeias listadas em bolsa estavam lá
Também foi interessante ver a quantidade de parceiros convidados. Ia de Microsoft, Accenture e EY até startups como alpic.ai e lingo.dev
Parece que eles também estão reforçando o movimento em M&A
Tirando o negócio em si, o design do site é realmente excelente: https://mistral.ai/
Recebi um e-mail da Mistral dizendo que vai descontinuar gradualmente, até agosto, alguns — talvez a maioria — dos modelos dedicados, como o devstral, e que agora deve-se usar modelos de uso geral
O custo cresce exponencialmente
Dizem para migrar do Devstral 2 (
devstral-2512edevstral-latest) para o modelo mais forte Mistral Medium 3.5 (mistral-medium-3-5, comreasoning_effortdefinido como "high"), e o preço é de $1.5/$7.5 por 1 milhão de tokens de entrada/saídaAntes era $0.4/$2
De qualquer forma, depois de receber o e-mail, torci para que isso fosse um sinal de que pretendem lançar um modelo novo e melhorado nos próximos meses
Parece não haver nenhum fosso competitivo. Parece uma consultoria de software com data center
Além disso, o texto diz que muitos clientes usam esses modelos on-premises, então o data center nem é exatamente uma vantagem
O que impediria qualquer startup com apoio do governo de fazer fine-tuning em pequenos modelos open source
Não estou dizendo que isso seja verdade, só que dá para partir dessa hipótese
Como europeu, concordo 100x
Entre esses players, gosto muito da direção e da transparência da Mistral
Dizem que a Abanca usa orquestração de agentes para processar informações sensíveis de clientes em uma “escala enorme” de 2 milhões de clientes do app, mas não sei se sou eu que tenho uma noção distorcida do que é escala enorme
Com 2 milhões de usuários, isso não daria só algumas centenas de MB de dados? Mesmo com bastante dado por usuário, imagino que seriam só alguns GB
Pelo que entendi da apresentação, parece que usaram agentes com responsabilidade limitada e provavelmente modelos menores para manter as respostas rápidas, estáveis e sem custo alto demais
Por outro lado, esse tipo de negócio pode até ter uma boa defensibilidade, mas normalmente não leva a uma rentabilidade tão alta