1 pontos por GN⁺ 5 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • A Mistral está se posicionando para ir além de uma simples empresa de modelos e se tornar uma companhia de IA full stack, reunindo computação, modelos, plataforma e consultoria
  • Com um data center de 40 MW em Paris e planos para data centers adicionais, a empresa se diferencia com modelos abertos e personalizados que os clientes podem possuir e executar on-premises
  • Em vez de anunciar novos modelos, o foco esteve em parcerias, com destaque para colaborações com ASML, BNP Paribas e Amazon Alexa+, além da apresentação do Vibe for Work
  • Em sistemas de agentes, o harness adiciona contexto, persistência e aprendizado, enquanto o raciocínio é tratado como essencial para recuperação de erros e manutenção da transparência
  • Modelos pequenos e especializados, junto com implantação on-premises, formam uma estratégia voltada a setores regulados e empresas europeias, com foco em retorno prático sobre investimento, e não na corrida por AGI

Posicionamento da Mistral

  • A Mistral está se movendo para além de uma empresa de modelos, em direção à construção de uma stack completa de IA, incluindo computação, modelos, plataforma e consultoria
  • A empresa possui um data center de 40 MW em Paris e também planeja data centers adicionais, incluindo na Suécia
  • O diferencial em relação a Anthropic ou OpenAI é oferecer modelos eficientes, abertos e personalizáveis, que os clientes podem possuir e executar on-premises
  • A mensagem do evento deu mais peso a parcerias do que a novos modelos ou inovações tecnológicas
    • As colaborações com ASML, BNP Paribas e Amazon Alexa+ foram apresentadas como exemplos de uso de IA para resolver problemas reais
    • Vibe for Work foi apresentado como um produto semelhante ao Claude for Work

Estratégia de produto e casos de uso

  • Sistemas de agentes e harness

    • Só o modelo não é suficiente, e o harness tem o papel de adicionar contexto, persistência e aprendizado
    • O raciocínio (reasoning) é tratado como um elemento central para permitir que o sistema volte atrás, se recupere de erros e mantenha a transparência
    • As boas práticas da organização são capturadas como skills e evoluem no processo de trabalho com agentes de IA
  • Modelos pequenos e especializados

    • A Mistral apresenta casos em que modelos pequenos, rápidos e bem focados superam grandes modelos de uso geral em eficiência energética e velocidade
    • Document AI é um modelo para OCR, usado pelo EU Patent Office em OCR em larga escala
    • Voxtral é um modelo de voz multilíngue, usado para operar o Amazon Alexa+ na Europa
    • Robostral é usado em robótica industrial com a ASML
    • Em aplicações baseadas em agentes com alto consumo de tokens, velocidade e eficiência se tornam tão importantes quanto o desempenho bruto
  • Soberania e implantação on-premises

    • O BNP Paribas executa modelos da Mistral on-premises na Bélgica para casos de uso de KYC, mantendo dados sensíveis dentro do banco
    • A Abanca usa orquestração de agentes para processar em escala informações sensíveis de mais de 1 milhão de clientes no app
    • Para empresas europeias em setores regulados, isso pode ser uma alternativa para reduzir a dependência de hyperscalers dos EUA
  • Aplicações em humanidades

    • Uma equipe de pesquisa da Austrian Academy of Sciences fez fine-tuning do LLM de código da Mistral, o Codestral, para ler fragmentos de papiro com milhares de anos
    • Esse trabalho ajuda a tornar acessível uma coleção de 180 mil documentos encontrados no deserto egípcio
    • Foi apresentado como uma tarefa que teria levado mais de 2.000 anos sem IA
    • O projeto Apollo da Austrian Academy of Sciences é um exemplo de como a IA também pode contribuir para as humanidades
  • Estratégia de parceira europeia de IA

    • A visão da Mistral está mais próxima de se tornar uma parceira europeia full stack de IA que entregue retorno real sobre investimento agora, do que de vencer a corrida por AGI
    • O sucesso dessa estratégia depende de mais empresas europeias adotarem a abordagem da Mistral
    • A combinação de modelos abertos, implantação on-premises e parcerias empresariais pode ser atraente para muitas grandes organizações da UE
    • A era da dependência cega das big techs dos EUA está chegando ao fim, e o importante é que surgiu um player europeu de IA para ser levado a sério

1 comentários

 
GN⁺ 5 시간 전
Comentários do Hacker News
  • Torço muito pela Mistral e pelos modelos pequenos especializados em tarefas, mas a Mistral ficou para trás demais desde o terceiro trimestre de 2025
    Para competir agora, é preciso conseguir rodar bons modelos de raciocínio mesmo com um comprimento de contexto intermediário, e a Mistral aparentemente não consegue fazer isso
    No momento, entre os modelos pequenos, Gemma4 e Qwen3.6 são os melhores, e o modelo “small” da Mistral tem 120B, cerca de 4 vezes mais parâmetros, e ainda assim não consegue competir direito nem com modelos de um quarto do tamanho
    Há um ano, na época do Mistral Small 3.1, eles ainda estavam acompanhando, mas agora quase desapareceram do radar
    Se a Mistral quer mirar seriamente o mercado on-premises e de modelos pequenos especializados em tarefas, criar um modelo que empolgue o pessoal do r/localLlama pode ser um indicador indireto bem útil

    • Concordo. Sou usuário pago do Le Chat Pro e torço muito por uma alternativa europeia, mas a diferença de qualidade entre a Mistral e os laboratórios de ponta está ficando grande demais para ignorar
      Também é preocupante que quase não tenham falado de modelos novos na conferência. Pessoalmente, acho que essa deveria ser a maior prioridade deles
      Fico curioso sobre o que está travando isso. Não sei se é dinheiro, recursos computacionais, capacidade, dados de treinamento ou outra coisa
      Para fazer um modelo realmente bom, talvez seja preciso treinar com dados bem questionáveis, como saídas de modelos de ponta, e tenho receio de que a Mistral seja europeia e voltada demais para clientes corporativos para assumir esse tipo de risco
    • A Mistral parece ter entrado naquela fase de extrair o máximo possível do dinheiro do contribuinte da UE em que acabam caindo empresas de tecnologia europeias que não são compradas por empresas americanas
      No fim, provavelmente vai virar uma empresa zumbi como a Dailymotion
    • Fugindo um pouco do assunto de modelos pequenos especializados em tarefas, mas como não entendo tanto disso, queria perguntar se existe algum motivo fundamental para os fornecedores de modelos de ponta não lançarem modelos menores e mais focados
      Por exemplo, penso em algo como um subconjunto do Opus voltado só para software, usado como padrão no Claude Code
      Seria menor, mais barato de implantar e usar, e talvez até mais rápido
    • Concordo. Quando os laboratórios de ponta fizerem o próximo aumento de preços e inevitavelmente reduzirem também os limites das faixas de assinatura, as pessoas vão repensar com muito mais seriedade quais provedores de modelo usar
      A Mistral precisa estar pronta para esse momento, mas olhando para os resultados recentes, realisticamente não dá para ter muita expectativa
    • Eu rodo LLMs localmente e, pessoalmente, 22B~32B é o maior tamanho que tenho disposição para testar
      Como o Mistral 4 tem 6B de parâmetros ativos por token, mesmo supondo que dê para colocar de 3 a 3,5 parâmetros por token numa 4090, algo como 240GB de download e armazenamento já fica perto do limite do que é viável para testar localmente
      Isso vale ainda mais quando se está baixando vários modelos para avaliar, e também dificulta que outras pessoas criem fine-tunings depois, como acontecia com os antigos modelos Mistral/Magistral
  • Ouvi a palestra de um excelente responsável de TI do governo, que está avaliando modelos e estava bastante insatisfeito com a situação atual
    Ele quer usar a Mistral e, em alguns casos, ela é até o único modelo baseado na UE que pode ser usado, mas também sabe que o desempenho é realmente ruim e está ficando cada vez mais atrás
    Talvez a Mistral ainda consiga construir um negócio lucrativo por ser o único modelo viável para certos usos na UE, mesmo sendo pior. É triste, e doloroso de ver

  • Eu realmente queria que a Europa participasse do desenvolvimento e da pesquisa em IA, e torci muito pela Mistral
    Mas a defasagem tecnológica está se acumulando demais. Se isso não for corrigido, será mais uma prova de que a Europa não consegue operar grandes empresas de tecnologia com bons resultados
    Na prática, quase todos os laboratórios chineses estão indo muito melhor. Nem precisa falar da DeepSeek; quem fez coisas como MiMo 2.5 e Minimax 2.7 não foi a Mistral
    Os modelos da Mistral são mais fracos, ou maiores e mais lentos, ou então não têm mistura de especialistas (MoE), então a situação não é boa

    • https://en.wikipedia.org/wiki/Artificial_Intelligence_Act#Pe...
      A Europa deu um tiro no próprio pé com essa lei, feita às pressas no auge da histeria pública, e agora nenhuma empresa minimamente sensata vai querer construir algo ali
      Uma startup de IA nos EUA ou na China pode começar com um garoto e um computador, mas na Europa esse garoto precisa de doze advogados
      O fato de a Mistral estar perdendo relevância apesar da vantagem inicial, dos primeiros modelos muito promissores e do investimento que recebeu pode ser consequência de ter tentado cumprir toda essa regulação
    • Não entendo bem o que significa dizer que a defasagem tecnológica está se acumulando demais. Não é mais fácil e barato alcançar quem lidera do que abrir o caminho na frente?
    • Sobre mistura de especialistas (MoE), lembro do Mixtral como o modelo que mostrou pela primeira vez a viabilidade prática de MoE
      Fiquei muito impressionado com aquele relatório técnico. Claro, pelo que sei, a ideia de MoE em si já existia antes
      Se tivessem levado a família Mixtral mais adiante, talvez hoje tivessem uma reputação parecida com a da linha Qwen. Foi uma oportunidade perdida
    • O governo britânico anunciou recentemente que vai investir 10 milhões de libras em pesquisa de IA, mas provavelmente os consultores vão ficar com a maior parte
      Comparado a isso, acho que a Europa até está indo relativamente bem
  • O BNP Paribas está operando modelos da Mistral on-premises na Bélgica para KYC, e o importante é que os dados sensíveis permaneçam dentro do banco
    A Abanca também está usando orquestração de agentes para processar grandes volumes de informações sensíveis de clientes, como os 2 milhões de clientes do app
    Para empresas europeias de setores regulados, isso é uma alternativa melhor do que depender de hyperscalers dos EUA, e o fato de a Mistral focar em modelos on-premises e hospedados na Europa parece uma direção muito inteligente

    • Falando com educação, eu não diria que é uma escolha “muito” inteligente. É só uma opção razoável em uma situação com alternativas limitadas
      Todo mundo está fazendo engenharia de implantação completa ou engenharia sob medida para clientes, porque, sem isso, a empresa passa a impressão de apenas adicionar margem em cima do custo de tokens
      Aí as empresas Neo-SaaS é que vão ficar com o dinheiro. Fora isso, quem compraria a IA da Mistral, e que outras opções haveria
    • O reforço da especialização da Mistral em implantação em larga escala com a aquisição da Koyeb também foi uma escolha certeira
    • Acho que a Mistral não está focando em geração de conteúdo como código, imagens e vídeo
      Em vez disso, parece estar se concentrando em outras áreas, como modelos multilíngues, OCR e voz
      A página de apresentação dos modelos também mostra isso, mas é tudo tão variado, com tantas categorias e nomes de modelos, que sempre me confundo
      Espero que as decisões deles deem bons resultados
    • Não é esse o caminho que startups da UE costumam seguir depois de abrir mão do mercado B2C ou do mercado global de SaaS? Voltar o foco para B2B de grandes empresas europeias e contratos governamentais
      Para startups europeias, B2B corporativo sempre me pareceu um lugar para ir morrer
    • Mesmo assim, qual seria o motivo para usar a Mistral on-premises? Em vez da Qwen
  • Estive no evento, e o tamanho do público foi impressionante; todos os líderes das principais empresas europeias listadas em bolsa estavam lá
    Também foi interessante ver a quantidade de parceiros convidados. Ia de Microsoft, Accenture e EY até startups como alpic.ai e lingo.dev
    Parece que eles também estão reforçando o movimento em M&A

  • Tirando o negócio em si, o design do site é realmente excelente: https://mistral.ai/

    • Parece complexo demais, e o posicionamento dos parágrafos também está desalinhado
    • Não sei exatamente o que teria de tão bom. Rolei no celular e me pareceu um site corporativo bem comum
    • Gosto de todo o branding da Mistral
  • Recebi um e-mail da Mistral dizendo que vai descontinuar gradualmente, até agosto, alguns — talvez a maioria — dos modelos dedicados, como o devstral, e que agora deve-se usar modelos de uso geral
    O custo cresce exponencialmente
    Dizem para migrar do Devstral 2 (devstral-2512 e devstral-latest) para o modelo mais forte Mistral Medium 3.5 (mistral-medium-3-5, com reasoning_effort definido como "high"), e o preço é de $1.5/$7.5 por 1 milhão de tokens de entrada/saída
    Antes era $0.4/$2

    • Recebi o mesmo e-mail, mas achei que já tinha migrado tudo para o Mistral-Medium-3.5, então não sei bem qual modelo com descontinuação prevista eu ainda estava usando
      De qualquer forma, depois de receber o e-mail, torci para que isso fosse um sinal de que pretendem lançar um modelo novo e melhorado nos próximos meses
  • Parece não haver nenhum fosso competitivo. Parece uma consultoria de software com data center
    Além disso, o texto diz que muitos clientes usam esses modelos on-premises, então o data center nem é exatamente uma vantagem
    O que impediria qualquer startup com apoio do governo de fazer fine-tuning em pequenos modelos open source

    • Talvez porque, ao destilar modelos maiores que você controla diretamente para modelos menores, seja possível obter modelos pequenos melhores do que fazendo fine-tuning com base em modelos maiores que você não controla
      Não estou dizendo que isso seja verdade, só que dá para partir dessa hipótese
  • Como europeu, concordo 100x
    Entre esses players, gosto muito da direção e da transparência da Mistral

    • Mesmo para quem não é europeu, é bom ver um concorrente europeu enfrentando os modelos dos EUA e da China
  • Dizem que a Abanca usa orquestração de agentes para processar informações sensíveis de clientes em uma “escala enorme” de 2 milhões de clientes do app, mas não sei se sou eu que tenho uma noção distorcida do que é escala enorme
    Com 2 milhões de usuários, isso não daria só algumas centenas de MB de dados? Mesmo com bastante dado por usuário, imagino que seriam só alguns GB

    • Pode ser, mas resolver solicitações de suporte ao cliente com os grandes modelos de linguagem atuais em um modo agentic faz o consumo de tokens disparar rapidamente
      Pelo que entendi da apresentação, parece que usaram agentes com responsabilidade limitada e provavelmente modelos menores para manter as respostas rápidas, estáveis e sem custo alto demais
    • Empresas europeias voltadas ao consumidor têm mais dificuldade para ganhar escala do que empresas americanas, e isso é uma grande parte do motivo de a Europa, no geral, enfrentar dificuldades para criar empresas de tecnologia
      Por outro lado, esse tipo de negócio pode até ter uma boa defensibilidade, mas normalmente não leva a uma rentabilidade tão alta