8 pontos por GN⁺ 2025-05-07 | 1 comentários | Compartilhar no WhatsApp
  • O Google lançou antecipadamente o Gemini 2.5 Pro Preview (I/O Edition) antes do evento oficial do I/O, com o objetivo de incorporar feedback de desenvolvedores e melhorar o desempenho
  • Ele apresenta desempenho especialmente forte em desenvolvimento frontend e de UI, com melhorias em transformação de código, edição e julgamento de abstração
  • Com base no desempenho de 84,8% no benchmark VideoMME, agora é possível gerar automaticamente apps de aprendizado baseados em vídeo
  • Por meio de raciocínio de design, também fica fácil implementar geração de UI personalizada ao estilo desejado e adicionar funcionalidades
  • A versão existente de 25 de março será atualizada automaticamente para a versão de 6 de maio, permitindo usar o modelo aprimorado sem trabalho adicional

Desempenho excelente em desenvolvimento frontend

  • O Gemini 2.5 Pro alcançou o 1º lugar no leaderboard do WebDev Arena
  • Com base em UI visualmente agradáveis e completude funcional, comprovou desempenho de ponta em avaliações de preferência humana
  • Em colaboração com Cognition e Replit, está ampliando as possibilidades da programação agentiva

Combinação de compreensão de código e capacidade de raciocínio

  • Vídeo → código

    • Com 84,8% de desempenho no benchmark VideoMME, garantiu capacidade de compreensão de vídeo em nível SOTA
    • É possível gerar automaticamente apps interativos de aprendizado com base em vídeos do YouTube
    • Entrega resultados com UI geral e nível de interação aprimorados em relação à versão anterior
  • Automação do desenvolvimento de funcionalidades

    • Antes, era necessário abrir arquivos de designers e converter manualmente em CSS itens como cores, fontes e margens
    • O Gemini 2.5 Pro consegue gerar automaticamente componentes personalizados ao estilo desejado
    • Ex.: é possível automatizar a adição de uma função de player de vídeo com estilo unificado ao app Gemini 95
  • Ideia → implementação de app mais rápida

    • Como no caso do dictation starter app, é possível gerar apps considerando ao mesmo tempo funcionalidade + acabamento estético
    • Gera automaticamente elementos detalhados de UI como animação de forma de onda, design responsivo e efeitos de mouseover
    • Mesmo sem o usuário desenhar diretamente, gera por padrão resultados com senso estético

Incorporação do feedback de desenvolvedores e forma de uso

  • Em comparação com a versão anterior, houve redução da taxa de erro em chamadas de função e melhoria nos gatilhos de chamada
  • A versão 03-25 existente passará automaticamente a apontar para a versão 05-06 → aplicado sem necessidade de atualização separada
  • Pode ser usado imediatamente no Google AI Studio e no Vertex AI
  • O model card também foi atualizado com as informações mais recentes
  • Será atualizado automaticamente para a versão mais recente, sem mudança de preço

Casos de uso e expectativa

  • Replit, Cursor e Cognition estão analisando a adoção ou já aplicando o modelo como agente de programação de próxima geração
  • A expectativa é que contribua para a expansão do fluxo de desenvolvimento agentivo de desenvolvedores individuais até empresas

1 comentários

 
GN⁺ 2025-05-07
Opiniões do Hacker News
  • No passado, ao usar modelos como esse para programação, a maior reclamação era a tendência de inventar APIs que não existem. Os modelos Gemini 2.5, especialmente as versões Pro e Flash, sofrem menos com esse problema do que outros modelos

    • Ainda há limitações consideráveis, e os modelos atuais ainda não conseguem abordar abstração e arquitetura como uma pessoa
    • No entanto, os modelos Gemini passaram a substituir buscas e o Stack Overflow na programação do dia a dia
  • Gemini 2.5 Pro ficou em 1º lugar no ranking do WebDev Arena

    • Talvez fizesse mais sentido renomear o WebDev Arena para React/Tailwind Arena
    • O prompt de sistema exige essas tecnologias, e a ferramenta inteira não funciona quando se pede Vanilla JS ou outros frameworks
    • É problemático que os modelos compitam com uma definição tão estreita de desenvolvimento web
  • Ao pedir código ao Gemini 2.5, ele gera comentários demais

    • Inclui uma quantidade excessiva de comentários de seção, de etapas, de bloco e inline
  • Gemini 2.5 é excelente para tarefas agentic, mas ainda tem dificuldade para gerar diffs perfeitos para edição de código

    • O Gemini 2.5 antigo gerava diffs adequados com 92% de precisão
    • Espera-se que esse índice aumente para 95-98%
  • Pergunta para alguém do Google: gostaria de saber se o Gemini-2.5-pro-exp (versão gratuita) também foi atualizado ou se vai desaparecer

    • Segundo a postagem no blog, a versão anterior (03-25) agora aponta para a versão mais recente (05-06), e não é necessária nenhuma ação adicional para usar o modelo melhorado
    • Gostaria de saber se o Gemini-2.5-pro-preview-03-25 agora usa a 05-06 e se o mesmo vale para o Gemini-2.5-pro-exp-03-25
  • Ao comparar os benchmarks do experimental 03-25 com o experimental 05-06, a nova versão teve pontuação um pouco menor em tudo, exceto no LiveCodeBench

  • Uso o Gemini para quase tudo, mas o model card só o compara com o o3-mini

    • Em benchmarks conhecidos, o o3 ainda está à frente
  • O Gemini 2.5 Pro é ótimo, mas a UI ainda tem problemas de rolagem que a tornam difícil de usar

    • É melhor esperar alguns minutos depois que a saída da IA termina
    • Também é confiável localizar o elemento ms-code-block nas ferramentas de desenvolvimento e registrar $0.textContext
  • O Gemini 2.5 Pro é ótimo, mas custa muito caro e oferece pouca transparência sobre os custos

    • Recentemente, muita gente recebeu cobranças inesperadas, e em alguns casos o uso normal gerou custos de US$ 500
    • Eu também fui afetado e removi a chave de API da ferramenta
  • Este modelo tem desempenho inferior ao 03-25 em 10 de 12 benchmarks

    • Continuaram treinando para código enquanto todo o resto piorava, e talvez tenham tentado esconder isso por causa do custo afundado
  • Gostaria de saber por que não podem usar um número de versão em vez de “novo preview”

    • Por exemplo, poderia se chamar Gemini Pro 2.5.1