2 pontos por GN⁺ 2025-11-19 | 1 comentários | Compartilhar no WhatsApp
  • Gemini 3 Pro é o modelo multimodal de raciocínio de próxima geração do Google, com arquitetura de alto desempenho para processar diversos tipos de entrada, como texto, imagem, áudio, vídeo e código
  • Usa uma arquitetura Transformer baseada em Sparse Mixture-of-Experts (MoE) para melhorar simultaneamente eficiência e desempenho
  • Os dados de treinamento são compostos por documentos da web, código, imagens, áudio, vídeo, dados de usuários e dados sintéticos, passando por processos de filtragem de segurança e remoção de duplicatas
  • O modelo foi treinado com TPU e JAX·ML Pathways e é disponibilizado por vários canais, como Google Cloud, Vertex AI e Gemini API
  • Passou por avaliações de segurança e validação do Frontier Safety Framework e alcançou melhorias em raciocínio, segurança e tom em relação ao Gemini 2.5 Pro

Visão geral do modelo

  • Gemini 3 Pro é a geração mais recente da série Gemini e o principal modelo do Google para raciocínio avançado e compreensão multimodal
    • Consegue compreender diferentes fontes de informação, como texto, áudio, imagem, vídeo e repositórios de código
    • Suporta até 1 milhão de tokens de entrada e até 64K tokens de saída
  • Adota uma estrutura Sparse Mixture-of-Experts (MoE), ativando apenas parte dos parâmetros especialistas para cada token de entrada, o que melhora a eficiência computacional
  • Em comparação com a geração anterior, a estrutura traz melhorias tanto em desempenho quanto em eficiência

Dados de treinamento

  • Os dados de pré-treinamento incluem vários domínios, como documentos públicos da web, código, imagens, áudio e vídeo
  • Os dados de pós-treinamento são compostos por pares validados de instrução-resposta, preferências humanas e dados de uso de ferramentas
  • Fontes dos dados
    • Conjuntos de dados públicos, dados coletados por crawling e dados com licença comercial
    • Dados de usuários de serviços do Google (coletados conforme os termos, políticas e controles do usuário)
    • Incluem dados gerados internamente pelo Google e dados sintéticos gerados por IA
  • Processo de pré-processamento
    • Realiza remoção de duplicatas, conformidade com robots.txt, filtragem de segurança e filtragem de qualidade
    • Remove conteúdos nocivos, como pornografia, violência e material de abuso sexual infantil (CSAM)

Implementação e sustentabilidade

  • Hardware: uso de TPU do Google
    • Acelera o treinamento com processamento em larga escala e memória de alta largura de banda
    • Garante escalabilidade e eficiência com treinamento distribuído por meio de TPU Pod
    • Alinhado às metas de sustentabilidade do Google
  • Software: treinamento baseado em JAX e ML Pathways

Canais de distribuição

  • O Gemini 3 Pro é disponibilizado nas seguintes plataformas
    • Gemini App, Google Cloud / Vertex AI, Google AI Studio, Gemini API, Google AI Mode, Google Antigravity
  • É fornecido em formato de API, sem exigência de hardware ou software adicional
  • O uso está sujeito aos termos de serviço e cláusulas adicionais de cada plataforma

Avaliação e desempenho

  • Escopo da avaliação: raciocínio, capacidade multimodal, uso de ferramentas, desempenho multilíngue e processamento de contexto longo
  • Resultado: o Gemini 3 Pro apresentou melhoria geral de desempenho em relação ao Gemini 2.5 Pro
    • Houve avanços especialmente grandes em capacidade de raciocínio e processamento multimodal
  • Os resultados detalhados de benchmark podem ser consultados em deepmind.com/models/evals/gemini-3-pro

Finalidade de uso e limitações

  • Principais áreas de uso:
    • Resolução de problemas complexos, trabalho criativo, planejamento estratégico e melhoria passo a passo
    • Desempenho de agente, codificação avançada, compreensão de contexto longo e desenvolvimento de algoritmos
  • Limitações:
    • Estão presentes limitações comuns de modelos de grande porte (ex.: alucinações)
    • Podem ocorrer latência ou timeout ocasionais
    • Corte de conhecimento: janeiro de 2025
  • Usos não permitidos:
    • Atos ilegais ou perigosos, violação de segurança, conteúdo sexual, violento ou de ódio, geração de desinformação etc.
    • Aplicação das políticas de uso proibido de IA generativa do Google

Ética e segurança de conteúdo

  • Processo de desenvolvimento: avaliações e testes de red team realizados em colaboração com equipes internas de segurança, proteção e responsabilidade
  • Tipos de avaliação
    • Monitoramento contínuo por meio de avaliações automáticas e humanas
    • Human Red Teaming com equipes externas especializadas
    • Verificações de segurança em larga escala com Red Teaming automatizado
    • Revisão ética e de segurança antes do lançamento
  • Políticas de segurança:
    1. Bloqueio de conteúdo relacionado a exploração e abuso sexual infantil
    2. Bloqueio de discurso de ódio
    3. Bloqueio de conteúdo que incentive suicídio ou atos perigosos
    4. Bloqueio de assédio e incitação à violência
    5. Bloqueio de conteúdo sexualmente explícito
    6. Bloqueio de aconselhamento médico contrário ao consenso científico

Resultados da avaliação de segurança

  • Resultados da avaliação automática (vs Gemini 2.5 Pro)
    • Text-to-Text Safety: -10.4%
    • Multilingual Safety: +0.2% (mudança não significativa)
    • Image-to-Text Safety: +3.1% (mudança não significativa)
    • Tone: +7.9%
    • Unjustified Refusals: +3.7% (mudança não significativa)
  • Interpretação: no geral, houve melhorias em tom e segurança, com redução na taxa de recusas incorretas
  • Resultados de Human Red Teaming:
    • Atende aos padrões de segurança infantil e apresentou desempenho de segurança equivalente ou melhor em relação ao Gemini 2.5 Pro
    • Mesmo em testes expandidos para além das áreas de política, nenhum problema grave foi identificado

Riscos e mitigação

  • Principais riscos:
    • Vulnerabilidade a jailbreak (melhorada, mas não totalmente resolvida)
    • Possível degradação de qualidade em conversas com vários turnos
  • Medidas de mitigação:
    • Filtragem de dados, pré-treinamento condicional, ajuste fino supervisionado e aprendizado por reforço com base em feedback humano e de críticos
    • Aplicação de políticas de segurança e filtragem no nível do produto

Avaliação de Frontier Safety

  • Verificado com base no Google DeepMind Frontier Safety Framework (setembro de 2025)
  • Resultado: não atingiu nenhum Critical Capability Level (CCL)
    • CBRN: insuficiente para elevar a capacidade de agentes de ameaça
    • Cibersegurança: resolve algumas tarefas (11/12), mas não resolve tarefas de alta dificuldade (0/13)
    • Manipulação nociva: sem aumento significativo em relação ao modelo anterior
    • P&D em machine learning: melhor em relação ao Gemini 2.5, mas abaixo do limiar de alerta
    • Risco de falso positivo, erro de julgamento e manipulação: permanece em nível baixo
  • Conclusão: ficou abaixo do limiar de risco nos critérios de Frontier Safety, com segurança assegurada

Resumo geral

  • O Gemini 3 Pro é o modelo multimodal de maior desempenho do Google, com melhorias em raciocínio, segurança e eficiência
  • O treinamento baseado em TPU e a estrutura MoE otimizam o processamento de dados em larga escala
  • Sistema reforçado de validação ética e de segurança, atendendo aos critérios do Frontier Safety Framework
  • Melhoria geral em relação ao Gemini 2.5 Pro, sendo avaliado como um modelo de IA seguro e escalável para uso no mundo real

1 comentários

 
GN⁺ 2025-11-19
Comentário do Hacker News
  • O comentário original foi movido para este tópico
    encerrou agradecendo pela organização