O Google está vencendo em todas as frentes da IA

(thealgorithmicbridge.com)

15 pontos por GN⁺ 2025-04-13 | 8 comentários | Compartilhar no WhatsApp

O Google está superando os concorrentes em desempenho de modelos de IA, competitividade de preços e integração em produtos, garantindo a liderança em toda a área de IA
Tendo o Gemini 2.5 Pro como centro, a empresa vem apresentando diversas tecnologias de IA generativa, como texto, imagem, música, vídeo, voz e agentes, e as integrando rapidamente ao ecossistema do Google
Com infraestrutura de nuvem, hardware dedicado para IA e até smartphones, o Google está em uma posição muito mais favorável do que OpenAI ou Anthropic para liderar a era da IA

O renascimento da DeepMind e a vantagem ampla do Google em IA

O autor é fã da DeepMind há muito tempo e relembra que, mais do que o ChatGPT, AlphaGo e AlphaZero foram os momentos verdadeiramente fascinantes da IA
O Google poderia ter assumido uma grande dianteira antes do lançamento do ChatGPT, mas perdeu a oportunidade por ter sido cauteloso demais na tentativa de proteger a receita de anúncios em busca
No entanto, desde então, Google e DeepMind não repetiram os erros e hoje lideram o setor de IA como um todo

O desempenho sem precedentes do Gemini 2.5 Pro

O Gemini 2.5 Pro Experimental está em primeiro lugar em vários benchmarks públicos e privados
- LMArena, GPQA Diamond, Humanity’s Last Exam, AIME (matemática), Aider Polyglot (programação), Live Bench (diversidade) etc.
- Tem desempenho melhor que o Claude Sonnet em jogar Pokémon e também está subindo rapidamente no Minecraft Bench
- Também apresenta excelentes resultados em escrita criativa e compreensão de textos longos
Nas avaliações dos usuários, predomina a percepção de que o Gemini 2.5 Pro é o melhor da indústria
- Muitos usuários em Reddit, X e outras plataformas compartilham experiências reais de uso que comprovam essa superioridade
Também se destaca em velocidade, preço e funcionalidades
- É rápido, barato e oferece uma janela de contexto de 1 milhão de tokens
- Está previsto para ser integrado ao portfólio de produtos do Google, como Gmail, Docs e Maps

O modelo leve Gemini Flash e o Gemma 3 open source

O Gemini 2.5 Flash é um modelo leve, otimizado para ambientes móveis e de edge
- É rápido, muito barato e, junto com as versões anteriores Flash, Flash Lite e Flash Thinking, apresenta excelente custo-benefício
O Gemma 3 é o modelo open source do Google e pode competir com Llama 4 e DeepSeek-V3

O equilíbrio perfeito entre preço e desempenho

O Google domina a fronteira de Pareto tanto em modelos de alto desempenho quanto nos de baixo custo
- Os modelos de maior desempenho continuam sendo eficientes em custo, e os modelos mais baratos também mostram desempenho suficientemente bom

Vantagem em todos os segmentos da IA generativa

Além dos modelos baseados em texto, o Gemini também está no mais alto nível em música (Lyria), imagem (Imagen 3), vídeo (Veo 2) e voz (Chirp 3)
- O Veo 2 é avaliado como mais aplicável na prática do que o Sora, da OpenAI

Sistemas de agentes e tecnologia de interface

O modo Deep Research do Gemini 2.5 Pro é considerado duas vezes melhor do que o da OpenAI
Diversos projetos estão em andamento, como o Project Astra (agente assistente) e o Project Mariner (interface de computador)
Também há planos de oferecer suporte tanto ao protocolo Agent2Agent quanto ao Model Context Protocol

Resultados contínuos de pesquisa e contribuição acadêmica

O Google DeepMind publica continuamente artigos em conferências de nível mundial como Nature, ICLR e NeurIPS
Também aborda AGI e IA industrial com alto nível de responsabilidade

O ecossistema do Google e a integração de IA

O Google é uma empresa de IA e também uma empresa de software para consumidores, capaz de integrar IA em toda a sua linha de produtos
- Busca, YouTube, Android, Gmail e Chrome estão entre os 7 produtos com 2 bilhões de usuários mensais nos quais a IA será incorporada
- Quando o Gemini for integrado a todo o ecossistema do Google, ele se consolidará como a melhor IA oferecida por padrão a bilhões de usuários

Competitividade em infraestrutura de nuvem e hardware

O Google aluga chips para modelos de IA por meio do Google Cloud e também desenvolve seus próprios chips TPU (Ironwood v7)
- A Microsoft apoia a OpenAI via nuvem, e a Amazon apoia a Anthropic, mas o Google faz tudo dentro do próprio ecossistema
- Também compete com a Nvidia na área de hardware para IA

Entrada também no mercado de smartphones

O Google vem embarcando o Gemini por padrão no Pixel 9, o que lhe permite competir também com Apple e Samsung
- Recursos baseados em IA, como compartilhamento de tela e controle da câmera, já foram implementados na prática
- Wearables e dispositivos de IA tentados por outras empresas estão fracassando

Conclusão: a vantagem decisiva de Google + DeepMind

O autor se diz surpreso com a vantagem ampla do Google, a ponto de estranhar ter depositado expectativas no passado em OpenAI, Anthropic e Meta
Ele continuará observando eventuais reações dos concorrentes, mas, por enquanto, está claro que o Google é o vencedor inequívoco da guerra da IA

8 comentários

phoon 2025-04-14

Não quer dizer que não existam modelos que superem o GPT-4.5 em especificações, mas... só de pedir uma tradução simples já dá para ver que a capacidade de construção de frases dos dois nem chega a ser parecida. (vitória esmagadora do GPT)
Acho que agora também precisamos discutir como os benchmarks e os conjuntos de teste devem ser estruturados.
Sem contar que também não são raras as avaliações de que o desempenho do próprio LLM, em tarefas gerais, fica abaixo do esperado...

guitarhero 2025-04-14

"O autor é fã do DeepMind há muito tempo,"

smboy86 2025-04-13

Também usei o 2.5 por um instante e, hmm... no fim, fiquei com a impressão de que o GPT é melhor; será que é questão de preferência pessoal?

mssmss 2025-04-14

Agora eu também uso mais o Gemini. Foi uma experiência em que a diferença foi ficando cada vez maior.

kandk 2025-04-14

Eu também tenho a sensação de que o gpt é melhor..

3xplore 2025-04-14

Eu percebi que o Gemini 2.5 oferece respostas com uma qualidade muito superior à do GPT, Claude e Grok 3.
Especialmente recentemente, o GPT ficou lento demais, então era desconfortável de usar.

GN⁺ 2025-04-13

Opiniões no Hacker News

Como ex-funcionário da OpenAI, vi muitos talentos importantes de ML saírem da OpenAI para outras startups. O app do ChatGPT é o principal produto de sucesso da OpenAI, mas há um limite para a receita que pode ser obtida com assinaturas. Em breve, espera-se a oferta de serviços gratuitos, e a publicidade deve se tornar a principal opção de monetização. O Google se sente desconfortável com a estratégia de aquisição de usuários da OpenAI. O Google precisa entregar inovação aos usuários rapidamente
Este texto não menciona TPUs. O ecossistema JAX + TPU do Google é excelente. O Google tem sua própria solução de computação, o que lhe dá vantagem na concorrência. Empresas de IA precisam responder à pergunta: "o que conseguem fazer que não pode ser feito em outro lugar?" A vantagem de hardware do Google oferece uma resposta real a essa pergunta
As opiniões sobre quem lidera a área de ML mudam com frequência. Alguns meses atrás, achava-se que o Google tinha fracassado, mas agora a OpenAI está perdendo popularidade. O Google está indo bem no momento, mas daqui a alguns meses a situação pode ser completamente diferente
O Google tem fraquezas em marketing, confiança, segurança e participação de mercado. No entanto, o modelo Gemini Pro 2.5 é excelente
Há quem ache que LLMs podem ser sustentados por publicidade. Um "adsense" baseado em LLM pode operar de forma muito sutil e engenhosa. Anúncios podem ser inseridos naturalmente no meio da conversa
Um usuário do Claude testou o Gemini 2.5 e ficou satisfeito graças ao ecossistema integrado do Google. O Google voltou a ter sucesso mais uma vez
Além do Gemini 2.5 Pro, o Gemini 2.0 Flash também é um modelo versátil. É barato, multimodal e oferece velocidade confiável. Também disponibiliza API em tempo real
O Gemini 2.5 Pro é duas vezes melhor que o Deep Research da OpenAI. O Deep Research do Google é mais profundo, mais completo e mais preciso
O Gemini 2.5 Pro é muito poderoso. No entanto, por causa de problemas na UI web, também uso o Claude Sonnet 3.7. O Google está aproveitando o maior mecanismo de busca e o YouTube no desenvolvimento de IA
Enquanto o Google continuar se limitando por causa da censura, não dá para usar seus produtos. O Gemini 2.5 Pro não conseguiu responder a certas perguntas. O ChatGPT 4o forneceu a resposta correta

iolothebard 2025-04-22

Parece que recebeu aulas particulares estilo coreano para prova… só vai bem em exame.
Mas, quando você realmente conversa com ele… é meio atrapalhado.