Mistral AI adiciona Deep Research, Voice, Projects e mais ao Le Chat

(mistral.ai)

3 pontos por GN⁺ 2025-07-18 | 1 comentários | Compartilhar no WhatsApp

A Mistral AI adicionou cinco novos recursos ao Le Chat para tornar a exploração, a expressão e a organização dos usuários mais naturais e poderosas
O modo Deep Research oferece um recurso que organiza rapidamente perguntas complexas em relatórios de pesquisa estruturados
O modo de voz permite conversas naturais e rápidas por meio do novo modelo de voz Voxtral, podendo ser usado sem digitação
O recurso de raciocínio multilíngue baseado no Magistral gera respostas claras e profundas em vários idiomas, com possibilidade de alternar idiomas dentro da mesma frase
O recurso Projects organiza e memoriza conversas, documentos e ideias por projeto, sendo adequado também para trabalhos de longo prazo

What’s new in Le Chat.

1. Modo Deep Research

Recurso que pesquisa rapidamente temas complexos em formato de relatório estruturado
Divide a pergunta do usuário, encontra fontes confiáveis e gera um relatório organizado
Um agente de Deep Research baseado em ferramentas é utilizado, mas a experiência do usuário permanece simples, transparente e com sensação de colaboração

2. Modo de voz

Permite conversas por voz naturais usando um novo modelo de voz chamado Voxtral
Adequado para várias situações, como brainstorming de ideias durante uma caminhada, respostas rápidas a perguntas na rua e transcrição de reuniões
Acompanha a velocidade da fala do usuário com baixa latência

3. Raciocínio multilíngue nativo

Com base no modelo de raciocínio Magistral, responde com clareza a perguntas complexas em vários idiomas
Vantajoso para usos multilíngues, como redigir um rascunho de proposta em espanhol ou explicar conceitos jurídicos em japonês
Também permite alternância de idiomas dentro da mesma frase (code-switching)

4. Projects

Organiza conversas relacionadas em pastas centradas no contexto
Cada projeto memoriza seu próprio estado de biblioteca e de configuração de ferramentas
Permite manter um ambiente de trabalho consistente com upload de documentos, carregamento do conteúdo da biblioteca, conversas e ideias
Útil para planejamento de mudança, design de recursos de produto e gerenciamento de projetos de longo prazo

5. Edição avançada de imagens

Diferentemente das ferramentas comuns de geração de imagens por texto, também é possível editar diretamente imagens geradas
Ex.: é possível modificar a cena com prompts como “remover objeto” ou “mover para outra cidade”
É possível editar em série mantendo a consistência de pessoas, objetos e elementos de design

1 comentários

GN⁺ 2025-07-18

Comentários no Hacker News

A função de edição de imagem parece realmente excelente; na verdade, dá a impressão de que esse é o principal destaque, mas isso não fica tão evidente. Os modelos da OpenAI tendem a alterar a imagem inteira e acabam degradando até detalhes sem relação com o pedido, enquanto este modelo impressiona por preservar perfeitamente as partes não relacionadas ao prompt e aplicar muito bem apenas a edição desejada. Ainda assim, a resolução de saída deixa a desejar (a imagem de entrada era bem maior, mas o resultado saiu com 1184px). Enviei uma foto do meu escritório em casa e pedi: "restaure os painéis cinza levemente rasgados na parte de baixo para que pareçam completamente novos"; o resultado ficou muito bom. A qualidade final é só ligeiramente inferior à original, mas imagino que isso também vá melhorar em breve
- Imagem de entrada: https://i.imgur.com/t0WCKAu.jpeg
- Imagem de resultado: https://i.imgur.com/xb99lmC.png
- Acho que esse tipo de tecnologia vai prejudicar bastante o Craigslist. Por exemplo, você vai ver um carro nas fotos e achar que está em ótimo estado, mas, ao chegar lá, o paralama está amassado, o capô tem um buraco e o farol está quebrado.
  Houve um caso em que um corretor usou IA para refazer completamente as fotos de uma casa, fazendo um imóvel velho parecer recém-construído. As pessoas foram visitar e ficaram furiosas. O corretor alegou que isso era só mais um nível de encenação, mas, nesse caso, não colou de jeito nenhum. No fim, o anúncio foi retirado, e muita gente chegou a aparecer para fazer reformas também (provavelmente parentes, mas não tenho certeza)
- Só para avisar: os links da imagem de entrada e da imagem de resultado que você postou são iguais. Fiquei confuso no começo tentando achar a diferença entre as fotos
- Para certas tarefas, o Kontext provavelmente é melhor, e talvez a Mistral esteja usando isso. Acima de tudo, é rápido e barato.
  Mas a OpenAI também lançou ontem um novo recurso de edição de imagens em maior resolução. Ainda não sei se isso vale só para a API ou se também vai para a interface de chat. Resultado com o mesmo prompt e a mesma imagem de entrada: https://i.imgur.com/w5Q0UQm.png
- Novidade da OpenAI: https://x.com/OpenAIDevs/status/1945538534884135132
- Eles estão usando o Flux Kontext da Black Forest Labs, e é um modelo realmente excelente
- Os títulos dos livros saíram embaralhados no resultado da imagem
Finalmente parece que a UE acordou. Tenho orgulho disso. Assim que meu contrato com a OpenAI acabar, pretendo migrar imediatamente para a Mistral. Precisamos apoiar a Europa, Viva La France
- Na verdade, eu só estou esperando o Mistral Large 3. Já houve indícios, e parece que em breve ele deve virar o modelo de linguagem padrão do novo Le Chat.
  No "One more thing" do post de blog do Mistral Medium 3, em maio, havia isso:
Mistral Small em março, Medium hoje, e um 'large' em preparação para breve. Como o modelo Medium já supera com folga outros modelos open source de referência (como o Llama 4 Maverick), o próximo passo promete bastante
Com essa versão, a diferença para os melhores modelos grandes talvez deixe de ser algo realmente relevante. A velocidade da Cerebras oferece uma experiência de uso excelente, mesmo comparada ao ChatGPT
Estou sofrendo de MRF, ou seja, Model Release Fatigue. Esses modelos gigantes estão saindo com tanta frequência que eu fico trocando de modelo na IDE o tempo todo, e quando volto a ligar algo que funcionava bem antes, agora parece pior.
Claude 4, gpt, llama, Gemini 2.5, pro-mini, mistral... ficar mudando o tempo todo dá até uma sensação de tontura
É fadiga de ficar alternando entre modelos de LLM
- Entendo o que você está sentindo, mas acho ótimo que tantas opções diferentes continuem aparecendo. O ritmo de inovação também é excelente. Se você quiser sempre usar o melhor modelo de todos, vai ser uma jornada cansativa, mas ainda assim acho muito melhor do que estagnação ou monopólio
- Por isso quase não estou usando essas novidades (embora sejam divertidas). Pretendo experimentar por conta própria lá para o segundo semestre de 2026. Até lá, os modelos locais e o hardware já terão evoluído.
  Meus respeitos a quem está aguentando essas versões experimentais agora
- Essa competição é justamente algo muito positivo. Eu só uso modelos premium e quase não gasto dinheiro. Sempre aparecem promoções ou oportunidades praticamente de graça
- Você não precisa acompanhar tudo. Basta usar de forma consistente um modelo que funcione bem para você
- A queda de desempenho das versões anteriores acontece porque os provedores concentram recursos nas versões novas. Também há o efeito do corte de data dos dados de treinamento nas versões antigas (por exemplo: claude sonnet 3.5→3.7).
  Pessoalmente, eu só uso Claude/Anthropic. Ele me entende melhor. Já é inteligente o bastante, então raramente sinto necessidade de usar a versão mais recente
O lançamento do Voxtral foi interessante porque voltou a dar força para transcrição de áudio open source competitiva (transcription, voz→texto). Não tenho certeza se realmente precisava de um backbone de LLM, mas, de qualquer forma, a abordagem é interessante
- Na prática, existem muito mais modelos open source fortes de reconhecimento de fala (STT).
  O comunicado da Mistral dá a entender que é a melhor coisa desde o Whisper, mas, na realidade, os comparativos não são com os modelos do topo.
  Benchmark aberto: https://huggingface.co/spaces/hf-audio/open_asr_leaderboard
  Para referência, o Scribe comparado pela Mistral está em 10º lugar.
  É um benchmark em inglês, mas há muitos modelos multilíngues ali também, então vale consultar (ex.: https://huggingface.co/nvidia/canary-1b-flash)
Hoje me interesso muito mais por modelos abertos em dados — e com dados eticamente auditáveis — do que por open code ou open weights.
Por exemplo, eu gostaria de usar um modelo capaz de me dizer se um recurso que especifiquei entrou ou não nos dados de treinamento
Hoje em dia é difícil escapar da impressão de que o setor de IA só está copiando os serviços da OpenAI.
Os serviços das outras empresas também são praticamente os mesmos, mudando mais a estrutura do que a proposta em si.
A inovação real também não parece tão grande assim
- Se você usar de verdade, não é nada igual. Em tarefas do dia a dia, como programação, as diferenças entre os modelos são enormes
- O mundo inteiro agora parece estar construindo novos serviços em cima de uma função f(input: string): string. É inevitável que as coisas fiquem parecidas
- A OpenAI também pegou o recurso Deep Research do Google. Usou o mesmo nome, e a Mistral fez o mesmo
- Na verdade, isso é competição de mercado saudável. Casos como o da Apple, que inovou durante décadas, são fruto de gatekeeping monopolista
- No fim das contas, quase a mesma tecnologia está sendo aplicada em todo lugar. A diferença é mais em dados de treinamento e poder computacional
Uso muito o ChatGPT. Quero testar o LeChat também, mas queria saber se existe uma grande diferença ou se é quase a mesma coisa
Se você ainda não usou o recurso Deep Research da OpenAI, recomendo muito. Ainda não encontrei um substituto realmente à altura. Também usei o do Google, mas não me impressionou tanto.
Para engenheiros estudando trade-offs, isso pode economizar uma quantidade enorme de tempo
- O recurso Research da Anthropic também é bem bom. Acho que está no nível da OpenAI.
  O do Google é um pouco mais preciso na versão paga, mas os relatórios são excessivamente prolixos e cansativos de ler. Parece trabalho de universitário enchendo linguiça para bater contagem de palavras
- Para mim, ajudou bastante especialmente em pesquisa de mercado (relacionada a startup). Foi como contratar um assistente júnior muito esperto de planejamento/PM
- Também recomendo testar o recurso de pesquisa do Kimi 2. Fiquei surpreso com a qualidade dos resultados
- Os resultados da OpenAI e do Gemini são bem diferentes. Não dá para dizer que um é melhor do que o outro; eles são simplesmente bastante distintos
- O Perplexities também não é ruim. Só não consigo comparar diretamente porque não tenho assinatura paga da OpenAI
Os exemplos de prompt não são bons. Por exemplo, no caso da resposta sobre planejamento pessoal, responder direto sem Deep Research é muito melhor (só a parte do visto foi respondida direito)
Será que o Voxtral poderia ser integrado ao teclado Futo para Android?

Mistral AI adiciona Deep Research, Voice, Projects e mais ao Le Chat

What’s new in Le Chat.

1. Modo Deep Research

2. Modo de voz

3. Raciocínio multilíngue nativo

4. Projects

5. Edição avançada de imagens

Leituras relacionadas

1 comentários

Comentários no Hacker News