Prévia do Gemini 2.5 Pro é lançada — modelo de IA do Google com desempenho de código ainda mais forte

(developers.googleblog.com)

8 pontos por GN⁺ 2025-05-07 | 1 comentários | Compartilhar no WhatsApp

O Google lançou antecipadamente o Gemini 2.5 Pro Preview (I/O Edition) antes do evento oficial do I/O, com o objetivo de incorporar feedback de desenvolvedores e melhorar o desempenho
Ele apresenta desempenho especialmente forte em desenvolvimento frontend e de UI, com melhorias em transformação de código, edição e julgamento de abstração
Com base no desempenho de 84,8% no benchmark VideoMME, agora é possível gerar automaticamente apps de aprendizado baseados em vídeo
Por meio de raciocínio de design, também fica fácil implementar geração de UI personalizada ao estilo desejado e adicionar funcionalidades
A versão existente de 25 de março será atualizada automaticamente para a versão de 6 de maio, permitindo usar o modelo aprimorado sem trabalho adicional

Desempenho excelente em desenvolvimento frontend

O Gemini 2.5 Pro alcançou o 1º lugar no leaderboard do WebDev Arena
Com base em UI visualmente agradáveis e completude funcional, comprovou desempenho de ponta em avaliações de preferência humana
Em colaboração com Cognition e Replit, está ampliando as possibilidades da programação agentiva

Combinação de compreensão de código e capacidade de raciocínio

Vídeo → código
- Com 84,8% de desempenho no benchmark VideoMME, garantiu capacidade de compreensão de vídeo em nível SOTA
- É possível gerar automaticamente apps interativos de aprendizado com base em vídeos do YouTube
- Entrega resultados com UI geral e nível de interação aprimorados em relação à versão anterior
Automação do desenvolvimento de funcionalidades
- Antes, era necessário abrir arquivos de designers e converter manualmente em CSS itens como cores, fontes e margens
- O Gemini 2.5 Pro consegue gerar automaticamente componentes personalizados ao estilo desejado
- Ex.: é possível automatizar a adição de uma função de player de vídeo com estilo unificado ao app Gemini 95
Ideia → implementação de app mais rápida
- Como no caso do dictation starter app, é possível gerar apps considerando ao mesmo tempo funcionalidade + acabamento estético
- Gera automaticamente elementos detalhados de UI como animação de forma de onda, design responsivo e efeitos de mouseover
- Mesmo sem o usuário desenhar diretamente, gera por padrão resultados com senso estético

Incorporação do feedback de desenvolvedores e forma de uso

Em comparação com a versão anterior, houve redução da taxa de erro em chamadas de função e melhoria nos gatilhos de chamada
A versão 03-25 existente passará automaticamente a apontar para a versão 05-06 → aplicado sem necessidade de atualização separada
Pode ser usado imediatamente no Google AI Studio e no Vertex AI
O model card também foi atualizado com as informações mais recentes
Será atualizado automaticamente para a versão mais recente, sem mudança de preço

Casos de uso e expectativa

Replit, Cursor e Cognition estão analisando a adoção ou já aplicando o modelo como agente de programação de próxima geração
A expectativa é que contribua para a expansão do fluxo de desenvolvimento agentivo de desenvolvedores individuais até empresas

1 comentários

GN⁺ 2025-05-07

Opiniões do Hacker News

No passado, ao usar modelos como esse para programação, a maior reclamação era a tendência de inventar APIs que não existem. Os modelos Gemini 2.5, especialmente as versões Pro e Flash, sofrem menos com esse problema do que outros modelos
- Ainda há limitações consideráveis, e os modelos atuais ainda não conseguem abordar abstração e arquitetura como uma pessoa
- No entanto, os modelos Gemini passaram a substituir buscas e o Stack Overflow na programação do dia a dia
Gemini 2.5 Pro ficou em 1º lugar no ranking do WebDev Arena
- Talvez fizesse mais sentido renomear o WebDev Arena para React/Tailwind Arena
- O prompt de sistema exige essas tecnologias, e a ferramenta inteira não funciona quando se pede Vanilla JS ou outros frameworks
- É problemático que os modelos compitam com uma definição tão estreita de desenvolvimento web
Ao pedir código ao Gemini 2.5, ele gera comentários demais
- Inclui uma quantidade excessiva de comentários de seção, de etapas, de bloco e inline
Gemini 2.5 é excelente para tarefas agentic, mas ainda tem dificuldade para gerar diffs perfeitos para edição de código
- O Gemini 2.5 antigo gerava diffs adequados com 92% de precisão
- Espera-se que esse índice aumente para 95-98%
Pergunta para alguém do Google: gostaria de saber se o Gemini-2.5-pro-exp (versão gratuita) também foi atualizado ou se vai desaparecer
- Segundo a postagem no blog, a versão anterior (03-25) agora aponta para a versão mais recente (05-06), e não é necessária nenhuma ação adicional para usar o modelo melhorado
- Gostaria de saber se o Gemini-2.5-pro-preview-03-25 agora usa a 05-06 e se o mesmo vale para o Gemini-2.5-pro-exp-03-25
Ao comparar os benchmarks do experimental 03-25 com o experimental 05-06, a nova versão teve pontuação um pouco menor em tudo, exceto no LiveCodeBench
Uso o Gemini para quase tudo, mas o model card só o compara com o o3-mini
- Em benchmarks conhecidos, o o3 ainda está à frente
O Gemini 2.5 Pro é ótimo, mas a UI ainda tem problemas de rolagem que a tornam difícil de usar
- É melhor esperar alguns minutos depois que a saída da IA termina
- Também é confiável localizar o elemento ms-code-block nas ferramentas de desenvolvimento e registrar $0.textContext
O Gemini 2.5 Pro é ótimo, mas custa muito caro e oferece pouca transparência sobre os custos
- Recentemente, muita gente recebeu cobranças inesperadas, e em alguns casos o uso normal gerou custos de US$ 500
- Eu também fui afetado e removi a chave de API da ferramenta
Este modelo tem desempenho inferior ao 03-25 em 10 de 12 benchmarks
- Continuaram treinando para código enquanto todo o resto piorava, e talvez tenham tentado esconder isso por causa do custo afundado
Gostaria de saber por que não podem usar um número de versão em vez de “novo preview”
- Por exemplo, poderia se chamar Gemini Pro 2.5.1

Prévia do Gemini 2.5 Pro é lançada — modelo de IA do Google com desempenho de código ainda mais forte

Desempenho excelente em desenvolvimento frontend

Combinação de compreensão de código e capacidade de raciocínio

Vídeo → código

Automação do desenvolvimento de funcionalidades

Ideia → implementação de app mais rápida

Incorporação do feedback de desenvolvedores e forma de uso

Casos de uso e expectativa

Leituras relacionadas

1 comentários

Opiniões do Hacker News