Notas do Mistral AI Now Summit

(koenvangilst.nl)

2 pontos por GN⁺ 2026-05-30 | 1 comentários | Compartilhar no WhatsApp

A Mistral está se posicionando para ir além de uma simples empresa de modelos e se tornar uma companhia de IA full stack, reunindo computação, modelos, plataforma e consultoria
Com um data center de 40 MW em Paris e planos para data centers adicionais, a empresa se diferencia com modelos abertos e personalizados que os clientes podem possuir e executar on-premises
Em vez de anunciar novos modelos, o foco esteve em parcerias, com destaque para colaborações com ASML, BNP Paribas e Amazon Alexa+, além da apresentação do Vibe for Work
Em sistemas de agentes, o harness adiciona contexto, persistência e aprendizado, enquanto o raciocínio é tratado como essencial para recuperação de erros e manutenção da transparência
Modelos pequenos e especializados, junto com implantação on-premises, formam uma estratégia voltada a setores regulados e empresas europeias, com foco em retorno prático sobre investimento, e não na corrida por AGI

Posicionamento da Mistral

A Mistral está se movendo para além de uma empresa de modelos, em direção à construção de uma stack completa de IA, incluindo computação, modelos, plataforma e consultoria
A empresa possui um data center de 40 MW em Paris e também planeja data centers adicionais, incluindo na Suécia
O diferencial em relação a Anthropic ou OpenAI é oferecer modelos eficientes, abertos e personalizáveis, que os clientes podem possuir e executar on-premises
A mensagem do evento deu mais peso a parcerias do que a novos modelos ou inovações tecnológicas
- As colaborações com ASML, BNP Paribas e Amazon Alexa+ foram apresentadas como exemplos de uso de IA para resolver problemas reais
- Vibe for Work foi apresentado como um produto semelhante ao Claude for Work

Estratégia de produto e casos de uso

Sistemas de agentes e harness
- Só o modelo não é suficiente, e o harness tem o papel de adicionar contexto, persistência e aprendizado
- O raciocínio (reasoning) é tratado como um elemento central para permitir que o sistema volte atrás, se recupere de erros e mantenha a transparência
- As boas práticas da organização são capturadas como skills e evoluem no processo de trabalho com agentes de IA
Modelos pequenos e especializados
- A Mistral apresenta casos em que modelos pequenos, rápidos e bem focados superam grandes modelos de uso geral em eficiência energética e velocidade
- Document AI é um modelo para OCR, usado pelo EU Patent Office em OCR em larga escala
- Voxtral é um modelo de voz multilíngue, usado para operar o Amazon Alexa+ na Europa
- Robostral é usado em robótica industrial com a ASML
- Em aplicações baseadas em agentes com alto consumo de tokens, velocidade e eficiência se tornam tão importantes quanto o desempenho bruto
Soberania e implantação on-premises
- O BNP Paribas executa modelos da Mistral on-premises na Bélgica para casos de uso de KYC, mantendo dados sensíveis dentro do banco
- A Abanca usa orquestração de agentes para processar em escala informações sensíveis de mais de 1 milhão de clientes no app
- Para empresas europeias em setores regulados, isso pode ser uma alternativa para reduzir a dependência de hyperscalers dos EUA
Aplicações em humanidades
- Uma equipe de pesquisa da Austrian Academy of Sciences fez fine-tuning do LLM de código da Mistral, o Codestral, para ler fragmentos de papiro com milhares de anos
- Esse trabalho ajuda a tornar acessível uma coleção de 180 mil documentos encontrados no deserto egípcio
- Foi apresentado como uma tarefa que teria levado mais de 2.000 anos sem IA
- O projeto Apollo da Austrian Academy of Sciences é um exemplo de como a IA também pode contribuir para as humanidades
Estratégia de parceira europeia de IA
- A visão da Mistral está mais próxima de se tornar uma parceira europeia full stack de IA que entregue retorno real sobre investimento agora, do que de vencer a corrida por AGI
- O sucesso dessa estratégia depende de mais empresas europeias adotarem a abordagem da Mistral
- A combinação de modelos abertos, implantação on-premises e parcerias empresariais pode ser atraente para muitas grandes organizações da UE
- A era da dependência cega das big techs dos EUA está chegando ao fim, e o importante é que surgiu um player europeu de IA para ser levado a sério

1 comentários

GN⁺ 2026-05-30

Comentários do Hacker News

Torço muito pela Mistral e pelos modelos pequenos especializados em tarefas, mas a Mistral ficou para trás demais desde o terceiro trimestre de 2025
Para competir agora, é preciso conseguir rodar bons modelos de raciocínio mesmo com um comprimento de contexto intermediário, e a Mistral aparentemente não consegue fazer isso
No momento, entre os modelos pequenos, Gemma4 e Qwen3.6 são os melhores, e o modelo “small” da Mistral tem 120B, cerca de 4 vezes mais parâmetros, e ainda assim não consegue competir direito nem com modelos de um quarto do tamanho
Há um ano, na época do Mistral Small 3.1, eles ainda estavam acompanhando, mas agora quase desapareceram do radar
Se a Mistral quer mirar seriamente o mercado on-premises e de modelos pequenos especializados em tarefas, criar um modelo que empolgue o pessoal do r/localLlama pode ser um indicador indireto bem útil
- Concordo. Sou usuário pago do Le Chat Pro e torço muito por uma alternativa europeia, mas a diferença de qualidade entre a Mistral e os laboratórios de ponta está ficando grande demais para ignorar
  Também é preocupante que quase não tenham falado de modelos novos na conferência. Pessoalmente, acho que essa deveria ser a maior prioridade deles
  Fico curioso sobre o que está travando isso. Não sei se é dinheiro, recursos computacionais, capacidade, dados de treinamento ou outra coisa
  Para fazer um modelo realmente bom, talvez seja preciso treinar com dados bem questionáveis, como saídas de modelos de ponta, e tenho receio de que a Mistral seja europeia e voltada demais para clientes corporativos para assumir esse tipo de risco
- A Mistral parece ter entrado naquela fase de extrair o máximo possível do dinheiro do contribuinte da UE em que acabam caindo empresas de tecnologia europeias que não são compradas por empresas americanas
  No fim, provavelmente vai virar uma empresa zumbi como a Dailymotion
- Fugindo um pouco do assunto de modelos pequenos especializados em tarefas, mas como não entendo tanto disso, queria perguntar se existe algum motivo fundamental para os fornecedores de modelos de ponta não lançarem modelos menores e mais focados
  Por exemplo, penso em algo como um subconjunto do Opus voltado só para software, usado como padrão no Claude Code
  Seria menor, mais barato de implantar e usar, e talvez até mais rápido
- Concordo. Quando os laboratórios de ponta fizerem o próximo aumento de preços e inevitavelmente reduzirem também os limites das faixas de assinatura, as pessoas vão repensar com muito mais seriedade quais provedores de modelo usar
  A Mistral precisa estar pronta para esse momento, mas olhando para os resultados recentes, realisticamente não dá para ter muita expectativa
- Eu rodo LLMs localmente e, pessoalmente, 22B~32B é o maior tamanho que tenho disposição para testar
  Como o Mistral 4 tem 6B de parâmetros ativos por token, mesmo supondo que dê para colocar de 3 a 3,5 parâmetros por token numa 4090, algo como 240GB de download e armazenamento já fica perto do limite do que é viável para testar localmente
  Isso vale ainda mais quando se está baixando vários modelos para avaliar, e também dificulta que outras pessoas criem fine-tunings depois, como acontecia com os antigos modelos Mistral/Magistral
Ouvi a palestra de um excelente responsável de TI do governo, que está avaliando modelos e estava bastante insatisfeito com a situação atual
Ele quer usar a Mistral e, em alguns casos, ela é até o único modelo baseado na UE que pode ser usado, mas também sabe que o desempenho é realmente ruim e está ficando cada vez mais atrás
Talvez a Mistral ainda consiga construir um negócio lucrativo por ser o único modelo viável para certos usos na UE, mesmo sendo pior. É triste, e doloroso de ver
Eu realmente queria que a Europa participasse do desenvolvimento e da pesquisa em IA, e torci muito pela Mistral
Mas a defasagem tecnológica está se acumulando demais. Se isso não for corrigido, será mais uma prova de que a Europa não consegue operar grandes empresas de tecnologia com bons resultados
Na prática, quase todos os laboratórios chineses estão indo muito melhor. Nem precisa falar da DeepSeek; quem fez coisas como MiMo 2.5 e Minimax 2.7 não foi a Mistral
Os modelos da Mistral são mais fracos, ou maiores e mais lentos, ou então não têm mistura de especialistas (MoE), então a situação não é boa
- https://en.wikipedia.org/wiki/Artificial_Intelligence_Act#Pe...
  A Europa deu um tiro no próprio pé com essa lei, feita às pressas no auge da histeria pública, e agora nenhuma empresa minimamente sensata vai querer construir algo ali
  Uma startup de IA nos EUA ou na China pode começar com um garoto e um computador, mas na Europa esse garoto precisa de doze advogados
  O fato de a Mistral estar perdendo relevância apesar da vantagem inicial, dos primeiros modelos muito promissores e do investimento que recebeu pode ser consequência de ter tentado cumprir toda essa regulação
- Não entendo bem o que significa dizer que a defasagem tecnológica está se acumulando demais. Não é mais fácil e barato alcançar quem lidera do que abrir o caminho na frente?
- Sobre mistura de especialistas (MoE), lembro do Mixtral como o modelo que mostrou pela primeira vez a viabilidade prática de MoE
  Fiquei muito impressionado com aquele relatório técnico. Claro, pelo que sei, a ideia de MoE em si já existia antes
  Se tivessem levado a família Mixtral mais adiante, talvez hoje tivessem uma reputação parecida com a da linha Qwen. Foi uma oportunidade perdida
- O governo britânico anunciou recentemente que vai investir 10 milhões de libras em pesquisa de IA, mas provavelmente os consultores vão ficar com a maior parte
  Comparado a isso, acho que a Europa até está indo relativamente bem
O BNP Paribas está operando modelos da Mistral on-premises na Bélgica para KYC, e o importante é que os dados sensíveis permaneçam dentro do banco
A Abanca também está usando orquestração de agentes para processar grandes volumes de informações sensíveis de clientes, como os 2 milhões de clientes do app
Para empresas europeias de setores regulados, isso é uma alternativa melhor do que depender de hyperscalers dos EUA, e o fato de a Mistral focar em modelos on-premises e hospedados na Europa parece uma direção muito inteligente
- Falando com educação, eu não diria que é uma escolha “muito” inteligente. É só uma opção razoável em uma situação com alternativas limitadas
  Todo mundo está fazendo engenharia de implantação completa ou engenharia sob medida para clientes, porque, sem isso, a empresa passa a impressão de apenas adicionar margem em cima do custo de tokens
  Aí as empresas Neo-SaaS é que vão ficar com o dinheiro. Fora isso, quem compraria a IA da Mistral, e que outras opções haveria
- O reforço da especialização da Mistral em implantação em larga escala com a aquisição da Koyeb também foi uma escolha certeira
- Acho que a Mistral não está focando em geração de conteúdo como código, imagens e vídeo
  Em vez disso, parece estar se concentrando em outras áreas, como modelos multilíngues, OCR e voz
  A página de apresentação dos modelos também mostra isso, mas é tudo tão variado, com tantas categorias e nomes de modelos, que sempre me confundo
  Espero que as decisões deles deem bons resultados
- Não é esse o caminho que startups da UE costumam seguir depois de abrir mão do mercado B2C ou do mercado global de SaaS? Voltar o foco para B2B de grandes empresas europeias e contratos governamentais
  Para startups europeias, B2B corporativo sempre me pareceu um lugar para ir morrer
- Mesmo assim, qual seria o motivo para usar a Mistral on-premises? Em vez da Qwen
Estive no evento, e o tamanho do público foi impressionante; todos os líderes das principais empresas europeias listadas em bolsa estavam lá
Também foi interessante ver a quantidade de parceiros convidados. Ia de Microsoft, Accenture e EY até startups como alpic.ai e lingo.dev
Parece que eles também estão reforçando o movimento em M&A
Tirando o negócio em si, o design do site é realmente excelente: https://mistral.ai/
- Parece complexo demais, e o posicionamento dos parágrafos também está desalinhado
- Não sei exatamente o que teria de tão bom. Rolei no celular e me pareceu um site corporativo bem comum
- Gosto de todo o branding da Mistral
Recebi um e-mail da Mistral dizendo que vai descontinuar gradualmente, até agosto, alguns — talvez a maioria — dos modelos dedicados, como o devstral, e que agora deve-se usar modelos de uso geral
O custo cresce exponencialmente
Dizem para migrar do Devstral 2 (devstral-2512 e devstral-latest) para o modelo mais forte Mistral Medium 3.5 (mistral-medium-3-5, com reasoning_effort definido como "high"), e o preço é de $1.5/$7.5 por 1 milhão de tokens de entrada/saída
Antes era $0.4/$2
- Recebi o mesmo e-mail, mas achei que já tinha migrado tudo para o Mistral-Medium-3.5, então não sei bem qual modelo com descontinuação prevista eu ainda estava usando
  De qualquer forma, depois de receber o e-mail, torci para que isso fosse um sinal de que pretendem lançar um modelo novo e melhorado nos próximos meses
Parece não haver nenhum fosso competitivo. Parece uma consultoria de software com data center
Além disso, o texto diz que muitos clientes usam esses modelos on-premises, então o data center nem é exatamente uma vantagem
O que impediria qualquer startup com apoio do governo de fazer fine-tuning em pequenos modelos open source
- Talvez porque, ao destilar modelos maiores que você controla diretamente para modelos menores, seja possível obter modelos pequenos melhores do que fazendo fine-tuning com base em modelos maiores que você não controla
  Não estou dizendo que isso seja verdade, só que dá para partir dessa hipótese
Como europeu, concordo 100x
Entre esses players, gosto muito da direção e da transparência da Mistral
- Mesmo para quem não é europeu, é bom ver um concorrente europeu enfrentando os modelos dos EUA e da China
Dizem que a Abanca usa orquestração de agentes para processar informações sensíveis de clientes em uma “escala enorme” de 2 milhões de clientes do app, mas não sei se sou eu que tenho uma noção distorcida do que é escala enorme
Com 2 milhões de usuários, isso não daria só algumas centenas de MB de dados? Mesmo com bastante dado por usuário, imagino que seriam só alguns GB
- Pode ser, mas resolver solicitações de suporte ao cliente com os grandes modelos de linguagem atuais em um modo agentic faz o consumo de tokens disparar rapidamente
  Pelo que entendi da apresentação, parece que usaram agentes com responsabilidade limitada e provavelmente modelos menores para manter as respostas rápidas, estáveis e sem custo alto demais
- Empresas europeias voltadas ao consumidor têm mais dificuldade para ganhar escala do que empresas americanas, e isso é uma grande parte do motivo de a Europa, no geral, enfrentar dificuldades para criar empresas de tecnologia
  Por outro lado, esse tipo de negócio pode até ter uma boa defensibilidade, mas normalmente não leva a uma rentabilidade tão alta

Notas do Mistral AI Now Summit

Posicionamento da Mistral

Estratégia de produto e casos de uso

Sistemas de agentes e harness

Modelos pequenos e especializados

Soberania e implantação on-premises

Aplicações em humanidades

Estratégia de parceira europeia de IA

Leituras relacionadas

1 comentários

Comentários do Hacker News