Gemini 2.5 Deep Think está disponível no app do Gemini
(blog.google)- Gemini 2.5 Deep Think foi disponibilizado no app Gemini para os assinantes do Google AI Ultra
- Novos métodos de pensamento paralelo (parallel thinking) e resultados de pesquisa foram incorporados, e, com base em um modelo que venceu a medalha de ouro da IMO, a versão foi melhorada para ficar mais adequada ao uso real
- Mostra desempenho excepcional em várias tarefas complexas, como resolução criativa de problemas, raciocínio matemático e científico e desenvolvimento de algoritmos
- Para melhorar o desempenho, o Tempo de Raciocínio (Thinking Time) é estendido para explorar simultaneamente várias ideias e soluções, gerando pensamento mais profundo e resultados criativos
- A segurança e o desenvolvimento responsável de IA foram fortalecidos com avaliações e ações de mitigação reforçadas, e os planos de expansão para API e uso corporativo foram anunciados
Lançamento do Gemini 2.5 Deep Think
- Gemini 2.5 Deep Think está disponível para assinantes do Google AI Ultra por meio do app Gemini
- Uma versão com feedback de testadores confiáveis e pesquisadores incorporados
- Baseado em um modelo de nível de ouro da recente Olimpíada Internacional de Matemática (IMO), com melhorias em velocidade e praticidade para a experiência do usuário real
- Com esta divulgação, o potencial do recurso como ferramenta de resolução criativa de problemas foi ampliado, e há planos para evoluir a funcionalidade com base em feedback de matemáticos e pesquisadores
Como o Deep Think funciona
- Com a adoção da pensagem paralela, o Gemini passa a explorar e comparar/compor, de forma simultânea, diversas ideias e soluções para problemas complexos
- Aumentando o Tempo de Inferência (Thinking Time) do modelo, é possível investigar várias hipóteses com mais profundidade para encontrar soluções mais criativas
- O aprendizado por reforço treina o modelo a explorar ativamente esses caminhos de inferência expandidos, fortalecendo uma resolução de problemas mais intuitiva e aprofundada
Principais desempenhos e áreas de uso do Deep Think
- Desenvolvimento e design iterativos: alto desempenho em tarefas que desenvolvem sistemas ou designs complexos passo a passo
- Descobertas científicas e matemáticas: bom desempenho em investigações criativas de alta complexidade, como raciocínio matemático e interpretação de artigos científicos
- Desenvolvimento de algoritmos e código: alcança desempenho de ponta em problemas de programação difíceis que exigem estruturação do problema, considerando complexidade de tempo e trade-offs
- Nos benchmarks mais recentes (ex.: LiveCodeBench V6, Humanity’s Last Exam), demonstrou desempenho de ponta em código/conhecimento/raciocínio em comparação com modelos anteriores
Desenvolvimento responsável e segurança do Gemini
- O Gemini 2.5 Deep Think apresenta segurança de conteúdo e tom mais objetivo melhorados em comparação ao modelo Pro anterior nas avaliações de segurança
- À medida que a complexidade aumenta, os riscos também são avaliados, com reforço da avaliação Frontier Safety e das medidas de resposta necessárias
- Os resultados detalhados de segurança podem ser consultados no Model Card
Como usar o Deep Think
- Assinantes do Google AI Ultra podem usar o recurso no app Gemini escolhendo 2.5 Pro no menu suspenso do modelo e ativando o Deep Think na barra de prompt, com limite de usos diário definido
- A integração com ferramentas como execução de código e busca no Google é automática, permitindo respostas muito mais longas
- Em breve serão feitos testes adicionais para o Gemini API e para o ambiente enterprise
1 comentários
Comentários no Hacker News
Testei o novo agente Deep Think, mas cheguei ao limite diário de uso logo depois de inserir cinco prompts. Se o serviço é isso por US$ 250 por mês, é bem decepcionante. Em termos de competitividade de preço, fica claramente atrás do o3-pro e do Grok 4 Heavy. Na comunidade de IA, esse recurso vinha recebendo atenção como praticamente a única parte que ainda poderia justificar o preço da assinatura Google Ultra. Mas o Google oferece seus melhores modelos de graça no AI Studio e, ao mesmo tempo, aplica esse tipo de política de cobrança aos assinantes Ultra que realmente pagam, o que sinceramente não faz sentido para mim. Em termos de desempenho, quando inseri um problema de negócios de alta complexidade, ele forneceu uma solução clara e convincente, alinhada com o resultado de uma reunião interna. No fim das contas, porém, o o3 também chegou a uma conclusão semelhante por um preço muito menor. Só que o relatório do o3 pareceu um pouco menos organizado. Acho que preciso usar mais para saber melhor
Pessoal, coloquei o prompt “desenhe uma imagem SVG de um pelicano andando de bicicleta” no Gemini Deep Think e este foi o resultado https://www.svgviewer.dev/s/5R5iTexQ Fiz antes do Simon Willison!
Se quiser testar por conta própria, dá para usar a CLI
llmdo simonw e o pluginllm-consortiumVantagem 1: dá para combinar vários modelos livremente. Você pode configurar as combinações que quiser, independentemente do laboratórioVantagem 2: usando o pluginllm-model-gateway, você pode conectar tudo de uma vez via API local ao seu app ou à sua ferramenta de colaboração para programação https://x.com/karpathy/status/1870692546969735361Ele até escreveu pessoalmente a instalação, exemplos de comandos e um exemplo mostrando que também dá para criar um consortium of consortium.
https://GitHub.com/irthomasthomas/llm-consortium
llm serveNão é o modelo que ganhou ouro na IMO algumas semanas atrás, mas é uma variante muito próxima https://x.com/OfficialLoganK/status/1951262261512659430 Ainda não está disponível via API
Esta abordagem é semelhante ao Grok 4 Heavy: executa vários agentes de “raciocínio” em paralelo, compara as respostas entre si e volta com a melhor, levando cerca de 30 minutos. O resultado é excelente, mas para uma comparação justa de benchmark, na prática ele deveria ser comparado com o Grok 4 Heavy, e não com o Grok 4 comum, que é um modelo de agente único e mais rápido
OpenAI foi para US$ 200, Anthropic para US$ 100 e US$ 200, Gemini para US$ 250, e Grok até US$ 300. Só a OpenAI disse “praticamente ilimitado”, e de fato nunca bati no limite do plano ChatGPT Pro. Já no Claude Max, atingi o limite várias vezes. Mas fico curioso por que essas empresas não divulgam claramente os limites
Nos últimos meses usando Gemini, tive a sensação de que ele está piorando cada vez mais. As hallucinations aparecem com frequência demais e, mesmo quando você aponta isso, a IA insiste. Está difícil confiar
Foi informado que assinantes do Google AI Ultra já podem usar hoje o recurso Deep Think no app Gemini, com uma quantidade fixa de prompts. Mas queria entender melhor se esse “conjunto fixo” significa um número fixo ou se quer dizer que os tipos de prompt são predefinidos
Ao usar o Gemini CLI para montar cronogramas, mesmo instruindo claramente várias vezes para não fazer mudanças inesperadas e mesmo intervindo, ele insiste em tentar alterar coisas por conta própria e acaba bagunçando o plano