- A Mistral AI adicionou cinco novos recursos ao Le Chat para tornar a exploração, a expressão e a organização dos usuários mais naturais e poderosas
- O modo Deep Research oferece um recurso que organiza rapidamente perguntas complexas em relatórios de pesquisa estruturados
- O modo de voz permite conversas naturais e rápidas por meio do novo modelo de voz Voxtral, podendo ser usado sem digitação
- O recurso de raciocínio multilíngue baseado no Magistral gera respostas claras e profundas em vários idiomas, com possibilidade de alternar idiomas dentro da mesma frase
- O recurso Projects organiza e memoriza conversas, documentos e ideias por projeto, sendo adequado também para trabalhos de longo prazo
What’s new in Le Chat.
1. Modo Deep Research
- Recurso que pesquisa rapidamente temas complexos em formato de relatório estruturado
- Divide a pergunta do usuário, encontra fontes confiáveis e gera um relatório organizado
- Um agente de Deep Research baseado em ferramentas é utilizado, mas a experiência do usuário permanece simples, transparente e com sensação de colaboração
2. Modo de voz
- Permite conversas por voz naturais usando um novo modelo de voz chamado Voxtral
- Adequado para várias situações, como brainstorming de ideias durante uma caminhada, respostas rápidas a perguntas na rua e transcrição de reuniões
- Acompanha a velocidade da fala do usuário com baixa latência
3. Raciocínio multilíngue nativo
- Com base no modelo de raciocínio Magistral, responde com clareza a perguntas complexas em vários idiomas
- Vantajoso para usos multilíngues, como redigir um rascunho de proposta em espanhol ou explicar conceitos jurídicos em japonês
- Também permite alternância de idiomas dentro da mesma frase (code-switching)
4. Projects
- Organiza conversas relacionadas em pastas centradas no contexto
- Cada projeto memoriza seu próprio estado de biblioteca e de configuração de ferramentas
- Permite manter um ambiente de trabalho consistente com upload de documentos, carregamento do conteúdo da biblioteca, conversas e ideias
- Útil para planejamento de mudança, design de recursos de produto e gerenciamento de projetos de longo prazo
5. Edição avançada de imagens
- Diferentemente das ferramentas comuns de geração de imagens por texto, também é possível editar diretamente imagens geradas
- Ex.: é possível modificar a cena com prompts como “remover objeto” ou “mover para outra cidade”
- É possível editar em série mantendo a consistência de pessoas, objetos e elementos de design
1 comentários
Comentários no Hacker News
A função de edição de imagem parece realmente excelente; na verdade, dá a impressão de que esse é o principal destaque, mas isso não fica tão evidente. Os modelos da OpenAI tendem a alterar a imagem inteira e acabam degradando até detalhes sem relação com o pedido, enquanto este modelo impressiona por preservar perfeitamente as partes não relacionadas ao prompt e aplicar muito bem apenas a edição desejada. Ainda assim, a resolução de saída deixa a desejar (a imagem de entrada era bem maior, mas o resultado saiu com 1184px). Enviei uma foto do meu escritório em casa e pedi: "restaure os painéis cinza levemente rasgados na parte de baixo para que pareçam completamente novos"; o resultado ficou muito bom. A qualidade final é só ligeiramente inferior à original, mas imagino que isso também vá melhorar em breve
Imagem de entrada: https://i.imgur.com/t0WCKAu.jpeg
Imagem de resultado: https://i.imgur.com/xb99lmC.png
Acho que esse tipo de tecnologia vai prejudicar bastante o Craigslist. Por exemplo, você vai ver um carro nas fotos e achar que está em ótimo estado, mas, ao chegar lá, o paralama está amassado, o capô tem um buraco e o farol está quebrado.
Houve um caso em que um corretor usou IA para refazer completamente as fotos de uma casa, fazendo um imóvel velho parecer recém-construído. As pessoas foram visitar e ficaram furiosas. O corretor alegou que isso era só mais um nível de encenação, mas, nesse caso, não colou de jeito nenhum. No fim, o anúncio foi retirado, e muita gente chegou a aparecer para fazer reformas também (provavelmente parentes, mas não tenho certeza)
Só para avisar: os links da imagem de entrada e da imagem de resultado que você postou são iguais. Fiquei confuso no começo tentando achar a diferença entre as fotos
Para certas tarefas, o Kontext provavelmente é melhor, e talvez a Mistral esteja usando isso. Acima de tudo, é rápido e barato.
Mas a OpenAI também lançou ontem um novo recurso de edição de imagens em maior resolução. Ainda não sei se isso vale só para a API ou se também vai para a interface de chat. Resultado com o mesmo prompt e a mesma imagem de entrada: https://i.imgur.com/w5Q0UQm.png
Novidade da OpenAI: https://x.com/OpenAIDevs/status/1945538534884135132
Eles estão usando o Flux Kontext da Black Forest Labs, e é um modelo realmente excelente
Os títulos dos livros saíram embaralhados no resultado da imagem
Finalmente parece que a UE acordou. Tenho orgulho disso. Assim que meu contrato com a OpenAI acabar, pretendo migrar imediatamente para a Mistral. Precisamos apoiar a Europa, Viva La France
No "One more thing" do post de blog do Mistral Medium 3, em maio, havia isso:
Estou sofrendo de MRF, ou seja, Model Release Fatigue. Esses modelos gigantes estão saindo com tanta frequência que eu fico trocando de modelo na IDE o tempo todo, e quando volto a ligar algo que funcionava bem antes, agora parece pior.
Claude 4, gpt, llama, Gemini 2.5, pro-mini, mistral... ficar mudando o tempo todo dá até uma sensação de tontura
É fadiga de ficar alternando entre modelos de LLM
Entendo o que você está sentindo, mas acho ótimo que tantas opções diferentes continuem aparecendo. O ritmo de inovação também é excelente. Se você quiser sempre usar o melhor modelo de todos, vai ser uma jornada cansativa, mas ainda assim acho muito melhor do que estagnação ou monopólio
Por isso quase não estou usando essas novidades (embora sejam divertidas). Pretendo experimentar por conta própria lá para o segundo semestre de 2026. Até lá, os modelos locais e o hardware já terão evoluído.
Meus respeitos a quem está aguentando essas versões experimentais agora
Essa competição é justamente algo muito positivo. Eu só uso modelos premium e quase não gasto dinheiro. Sempre aparecem promoções ou oportunidades praticamente de graça
Você não precisa acompanhar tudo. Basta usar de forma consistente um modelo que funcione bem para você
A queda de desempenho das versões anteriores acontece porque os provedores concentram recursos nas versões novas. Também há o efeito do corte de data dos dados de treinamento nas versões antigas (por exemplo: claude sonnet 3.5→3.7).
Pessoalmente, eu só uso Claude/Anthropic. Ele me entende melhor. Já é inteligente o bastante, então raramente sinto necessidade de usar a versão mais recente
O lançamento do Voxtral foi interessante porque voltou a dar força para transcrição de áudio open source competitiva (transcription, voz→texto). Não tenho certeza se realmente precisava de um backbone de LLM, mas, de qualquer forma, a abordagem é interessante
O comunicado da Mistral dá a entender que é a melhor coisa desde o Whisper, mas, na realidade, os comparativos não são com os modelos do topo.
Benchmark aberto: https://huggingface.co/spaces/hf-audio/open_asr_leaderboard
Para referência, o Scribe comparado pela Mistral está em 10º lugar.
É um benchmark em inglês, mas há muitos modelos multilíngues ali também, então vale consultar (ex.: https://huggingface.co/nvidia/canary-1b-flash)
Hoje me interesso muito mais por modelos abertos em dados — e com dados eticamente auditáveis — do que por open code ou open weights.
Por exemplo, eu gostaria de usar um modelo capaz de me dizer se um recurso que especifiquei entrou ou não nos dados de treinamento
Hoje em dia é difícil escapar da impressão de que o setor de IA só está copiando os serviços da OpenAI.
Os serviços das outras empresas também são praticamente os mesmos, mudando mais a estrutura do que a proposta em si.
A inovação real também não parece tão grande assim
Se você usar de verdade, não é nada igual. Em tarefas do dia a dia, como programação, as diferenças entre os modelos são enormes
O mundo inteiro agora parece estar construindo novos serviços em cima de uma função
f(input: string): string. É inevitável que as coisas fiquem parecidasA OpenAI também pegou o recurso Deep Research do Google. Usou o mesmo nome, e a Mistral fez o mesmo
Na verdade, isso é competição de mercado saudável. Casos como o da Apple, que inovou durante décadas, são fruto de gatekeeping monopolista
No fim das contas, quase a mesma tecnologia está sendo aplicada em todo lugar. A diferença é mais em dados de treinamento e poder computacional
Uso muito o ChatGPT. Quero testar o LeChat também, mas queria saber se existe uma grande diferença ou se é quase a mesma coisa
Se você ainda não usou o recurso Deep Research da OpenAI, recomendo muito. Ainda não encontrei um substituto realmente à altura. Também usei o do Google, mas não me impressionou tanto.
Para engenheiros estudando trade-offs, isso pode economizar uma quantidade enorme de tempo
O recurso Research da Anthropic também é bem bom. Acho que está no nível da OpenAI.
O do Google é um pouco mais preciso na versão paga, mas os relatórios são excessivamente prolixos e cansativos de ler. Parece trabalho de universitário enchendo linguiça para bater contagem de palavras
Para mim, ajudou bastante especialmente em pesquisa de mercado (relacionada a startup). Foi como contratar um assistente júnior muito esperto de planejamento/PM
Também recomendo testar o recurso de pesquisa do Kimi 2. Fiquei surpreso com a qualidade dos resultados
Os resultados da OpenAI e do Gemini são bem diferentes. Não dá para dizer que um é melhor do que o outro; eles são simplesmente bastante distintos
O Perplexities também não é ruim. Só não consigo comparar diretamente porque não tenho assinatura paga da OpenAI
Os exemplos de prompt não são bons. Por exemplo, no caso da resposta sobre planejamento pessoal, responder direto sem Deep Research é muito melhor (só a parte do visto foi respondida direito)
Será que o Voxtral poderia ser integrado ao teclado Futo para Android?