- O Google apresentou novas versões preview do Gemini 2.5 Flash e do 2.5 Flash-Lite, com foco principal em melhorias de qualidade e eficiência
- O Flash-Lite foi otimizado para ambientes de alta velocidade e baixo custo com maior compreensão de instruções, menos respostas prolixas e melhorias em multimodalidade e tradução
- O Flash teve reforço no uso de ferramentas e melhor eficiência de tokens, elevando bastante o desempenho em tarefas complexas no estilo agente
- Em testes reais, a pontuação no SWE-Bench Verified subiu 5%, e em benchmarks internos o desempenho em tarefas de longo prazo melhorou 15%
- Ambos os modelos agora oferecem suporte ao alias
-latest, permitindo usar os recursos mais recentes sem alterar o código; para quem busca estabilidade, os modelos 2.5 existentes continuam disponíveis
Visão geral do Gemini 2.5 Flash e Flash-Lite
- As versões mais recentes do Gemini 2.5 Flash e Flash-Lite foram disponibilizadas no Google AI Studio e no Vertex AI. O objetivo deste lançamento é continuar entregando melhor qualidade de modelo e maior eficiência
- O novo Flash-Lite e o novo Flash mostram desempenho muito superior em qualidade geral, velocidade e custo em comparação com os modelos anteriores
- O Flash-Lite reduziu os tokens de saída em 50%, e o Flash em 24%, oferecendo economia de custo operacional e processamento mais rápido
Updated Gemini 2.5 Flash-Lite
- Melhor aderência a instruções: a capacidade de entender e executar instruções complexas ou prompts de sistema melhorou significativamente
- Mais concisão: gera respostas mais curtas e fáceis de entender, reduzindo custo com tokens e a latência em ambientes de grande volume de tráfego
- Melhorias em multimodalidade e qualidade de tradução: houve aumento da confiabilidade em transcrição de áudio, reconhecimento de imagem e tradução
- A versão preview do Flash-Lite já pode ser testada com o nome de modelo
gemini-2.5-flash-lite-preview-09-2025
Updated Gemini 2.5 Flash
- Capacidade ampliada de uso de ferramentas: o aproveitamento em cenários complexos e multietapas baseados em agentes aumentou bastante, alcançando desempenho 5 pontos percentuais superior ao da versão anterior no SWE-Bench Verified (48.9% → 54%)
- Maior eficiência de custo: entrega maior qualidade de saída com menos uso de tokens, reduzindo latência e custos de infraestrutura
- O feedback dos usuários do Primer também foi positivo
- Yichao ‘Peak’ Ji, cofundador e Chief Scientist da Manus, avaliou: "O novo modelo Gemini 2.5 Flash oferece velocidade e inteligência impressionantes ao mesmo tempo. Em tarefas de agentes orientadas por objetivos de longo prazo, o desempenho melhorou 15%, ampliando ainda mais a escala com base na eficiência de custos"
- A versão preview do Gemini 2.5 Flash está disponível com o nome de modelo
gemini-2.5-flash-preview-09-2025
Começando a desenvolver com Gemini
- Ao longo do último ano, a empresa lançou modelos preview para que desenvolvedores pudessem testar rapidamente os recursos mais recentes e enviar feedback.
- As versões preview apresentadas hoje não estão sendo oficialmente promovidas a uma nova versão estável, mas serão usadas como base para elevar a qualidade da próxima versão oficial
- Em vez de nomes de modelo longos, foi adicionado o alias
-latest, facilitando o uso contínuo do modelo mais recente. Esse alias aponta automaticamente para a versão atual, permitindo testar novos recursos sem alterar o código
gemini-flash-latest
gemini-flash-lite-latest
- Caso uma versão específica seja atualizada ou descontinuada, haverá aviso por e-mail com pelo menos 2 semanas de antecedência. O alias é apenas uma referência simples, e preço, recursos e limites podem variar conforme cada release
- Para quem precisa de estabilidade de longo prazo, é recomendado continuar usando os nomes de modelo
gemini-2.5-flash e gemini-2.5-flash-lite
Significado
- Este release é uma atualização preview, e não uma promoção para versão estável oficial, fazendo parte do processo de experimentação e coleta de feedback dos usuários para futuros modelos estáveis
- Com o Gemini, o Google segue buscando equilíbrio entre velocidade, inteligência e eficiência de custo, enquanto continua aprimorando a plataforma para que desenvolvedores criem aplicações de IA melhores
1 comentários
Comentários no Hacker News
application/jsonno pedido, o uso de ferramentas fica indisponível, e para usar os dois juntos é preciso ou torcer para que o JSON saia válido na marra (o que falha com frequência) ou usar ferramentas na primeira requisição e formatar na segunda. É incômodo, mas o contorno é relativamente simplesuvxsem instalação separada. Exemplo:As notas de release estão aqui. Para a discussão sobre pelicanos, veja este post
gemini-2.5-flash-lite-preview-09-2025egemini-2.5-flash-preview-09-2025