- Gemini 3 Pro é o modelo multimodal de raciocínio de próxima geração do Google, com arquitetura de alto desempenho para processar diversos tipos de entrada, como texto, imagem, áudio, vídeo e código
- Usa uma arquitetura Transformer baseada em Sparse Mixture-of-Experts (MoE) para melhorar simultaneamente eficiência e desempenho
- Os dados de treinamento são compostos por documentos da web, código, imagens, áudio, vídeo, dados de usuários e dados sintéticos, passando por processos de filtragem de segurança e remoção de duplicatas
- O modelo foi treinado com TPU e JAX·ML Pathways e é disponibilizado por vários canais, como Google Cloud, Vertex AI e Gemini API
- Passou por avaliações de segurança e validação do Frontier Safety Framework e alcançou melhorias em raciocínio, segurança e tom em relação ao Gemini 2.5 Pro
Visão geral do modelo
- Gemini 3 Pro é a geração mais recente da série Gemini e o principal modelo do Google para raciocínio avançado e compreensão multimodal
- Consegue compreender diferentes fontes de informação, como texto, áudio, imagem, vídeo e repositórios de código
- Suporta até 1 milhão de tokens de entrada e até 64K tokens de saída
- Adota uma estrutura Sparse Mixture-of-Experts (MoE), ativando apenas parte dos parâmetros especialistas para cada token de entrada, o que melhora a eficiência computacional
- Em comparação com a geração anterior, a estrutura traz melhorias tanto em desempenho quanto em eficiência
Dados de treinamento
- Os dados de pré-treinamento incluem vários domínios, como documentos públicos da web, código, imagens, áudio e vídeo
- Os dados de pós-treinamento são compostos por pares validados de instrução-resposta, preferências humanas e dados de uso de ferramentas
- Fontes dos dados
- Conjuntos de dados públicos, dados coletados por crawling e dados com licença comercial
- Dados de usuários de serviços do Google (coletados conforme os termos, políticas e controles do usuário)
- Incluem dados gerados internamente pelo Google e dados sintéticos gerados por IA
- Processo de pré-processamento
- Realiza remoção de duplicatas, conformidade com robots.txt, filtragem de segurança e filtragem de qualidade
- Remove conteúdos nocivos, como pornografia, violência e material de abuso sexual infantil (CSAM)
Implementação e sustentabilidade
- Hardware: uso de TPU do Google
- Acelera o treinamento com processamento em larga escala e memória de alta largura de banda
- Garante escalabilidade e eficiência com treinamento distribuído por meio de TPU Pod
- Alinhado às metas de sustentabilidade do Google
- Software: treinamento baseado em JAX e ML Pathways
Canais de distribuição
- O Gemini 3 Pro é disponibilizado nas seguintes plataformas
- Gemini App, Google Cloud / Vertex AI, Google AI Studio, Gemini API, Google AI Mode, Google Antigravity
- É fornecido em formato de API, sem exigência de hardware ou software adicional
- O uso está sujeito aos termos de serviço e cláusulas adicionais de cada plataforma
Avaliação e desempenho
- Escopo da avaliação: raciocínio, capacidade multimodal, uso de ferramentas, desempenho multilíngue e processamento de contexto longo
- Resultado: o Gemini 3 Pro apresentou melhoria geral de desempenho em relação ao Gemini 2.5 Pro
- Houve avanços especialmente grandes em capacidade de raciocínio e processamento multimodal
- Os resultados detalhados de benchmark podem ser consultados em deepmind.com/models/evals/gemini-3-pro
Finalidade de uso e limitações
- Principais áreas de uso:
- Resolução de problemas complexos, trabalho criativo, planejamento estratégico e melhoria passo a passo
- Desempenho de agente, codificação avançada, compreensão de contexto longo e desenvolvimento de algoritmos
- Limitações:
- Estão presentes limitações comuns de modelos de grande porte (ex.: alucinações)
- Podem ocorrer latência ou timeout ocasionais
- Corte de conhecimento: janeiro de 2025
- Usos não permitidos:
- Atos ilegais ou perigosos, violação de segurança, conteúdo sexual, violento ou de ódio, geração de desinformação etc.
- Aplicação das políticas de uso proibido de IA generativa do Google
Ética e segurança de conteúdo
- Processo de desenvolvimento: avaliações e testes de red team realizados em colaboração com equipes internas de segurança, proteção e responsabilidade
- Tipos de avaliação
- Monitoramento contínuo por meio de avaliações automáticas e humanas
- Human Red Teaming com equipes externas especializadas
- Verificações de segurança em larga escala com Red Teaming automatizado
- Revisão ética e de segurança antes do lançamento
- Políticas de segurança:
- Bloqueio de conteúdo relacionado a exploração e abuso sexual infantil
- Bloqueio de discurso de ódio
- Bloqueio de conteúdo que incentive suicídio ou atos perigosos
- Bloqueio de assédio e incitação à violência
- Bloqueio de conteúdo sexualmente explícito
- Bloqueio de aconselhamento médico contrário ao consenso científico
Resultados da avaliação de segurança
- Resultados da avaliação automática (vs Gemini 2.5 Pro)
- Text-to-Text Safety: -10.4%
- Multilingual Safety: +0.2% (mudança não significativa)
- Image-to-Text Safety: +3.1% (mudança não significativa)
- Tone: +7.9%
- Unjustified Refusals: +3.7% (mudança não significativa)
- Interpretação: no geral, houve melhorias em tom e segurança, com redução na taxa de recusas incorretas
- Resultados de Human Red Teaming:
- Atende aos padrões de segurança infantil e apresentou desempenho de segurança equivalente ou melhor em relação ao Gemini 2.5 Pro
- Mesmo em testes expandidos para além das áreas de política, nenhum problema grave foi identificado
Riscos e mitigação
- Principais riscos:
- Vulnerabilidade a jailbreak (melhorada, mas não totalmente resolvida)
- Possível degradação de qualidade em conversas com vários turnos
- Medidas de mitigação:
- Filtragem de dados, pré-treinamento condicional, ajuste fino supervisionado e aprendizado por reforço com base em feedback humano e de críticos
- Aplicação de políticas de segurança e filtragem no nível do produto
Avaliação de Frontier Safety
- Verificado com base no Google DeepMind Frontier Safety Framework (setembro de 2025)
- Resultado: não atingiu nenhum Critical Capability Level (CCL)
- CBRN: insuficiente para elevar a capacidade de agentes de ameaça
- Cibersegurança: resolve algumas tarefas (11/12), mas não resolve tarefas de alta dificuldade (0/13)
- Manipulação nociva: sem aumento significativo em relação ao modelo anterior
- P&D em machine learning: melhor em relação ao Gemini 2.5, mas abaixo do limiar de alerta
- Risco de falso positivo, erro de julgamento e manipulação: permanece em nível baixo
- Conclusão: ficou abaixo do limiar de risco nos critérios de Frontier Safety, com segurança assegurada
Resumo geral
- O Gemini 3 Pro é o modelo multimodal de maior desempenho do Google, com melhorias em raciocínio, segurança e eficiência
- O treinamento baseado em TPU e a estrutura MoE otimizam o processamento de dados em larga escala
- Sistema reforçado de validação ética e de segurança, atendendo aos critérios do Frontier Safety Framework
- Melhoria geral em relação ao Gemini 2.5 Pro, sendo avaliado como um modelo de IA seguro e escalável para uso no mundo real
1 comentários
Comentário do Hacker News
encerrou agradecendo pela organização