Cartão do modelo Gemini 3 Pro

(pixeldrain.com)

2 pontos por GN⁺ 2025-11-19 | 1 comentários | Compartilhar no WhatsApp

Gemini 3 Pro é o modelo multimodal de raciocínio de próxima geração do Google, com arquitetura de alto desempenho para processar diversos tipos de entrada, como texto, imagem, áudio, vídeo e código
Usa uma arquitetura Transformer baseada em Sparse Mixture-of-Experts (MoE) para melhorar simultaneamente eficiência e desempenho
Os dados de treinamento são compostos por documentos da web, código, imagens, áudio, vídeo, dados de usuários e dados sintéticos, passando por processos de filtragem de segurança e remoção de duplicatas
O modelo foi treinado com TPU e JAX·ML Pathways e é disponibilizado por vários canais, como Google Cloud, Vertex AI e Gemini API
Passou por avaliações de segurança e validação do Frontier Safety Framework e alcançou melhorias em raciocínio, segurança e tom em relação ao Gemini 2.5 Pro

Visão geral do modelo

Gemini 3 Pro é a geração mais recente da série Gemini e o principal modelo do Google para raciocínio avançado e compreensão multimodal
- Consegue compreender diferentes fontes de informação, como texto, áudio, imagem, vídeo e repositórios de código
- Suporta até 1 milhão de tokens de entrada e até 64K tokens de saída
Adota uma estrutura Sparse Mixture-of-Experts (MoE), ativando apenas parte dos parâmetros especialistas para cada token de entrada, o que melhora a eficiência computacional
Em comparação com a geração anterior, a estrutura traz melhorias tanto em desempenho quanto em eficiência

Dados de treinamento

Os dados de pré-treinamento incluem vários domínios, como documentos públicos da web, código, imagens, áudio e vídeo
Os dados de pós-treinamento são compostos por pares validados de instrução-resposta, preferências humanas e dados de uso de ferramentas
Fontes dos dados
- Conjuntos de dados públicos, dados coletados por crawling e dados com licença comercial
- Dados de usuários de serviços do Google (coletados conforme os termos, políticas e controles do usuário)
- Incluem dados gerados internamente pelo Google e dados sintéticos gerados por IA
Processo de pré-processamento
- Realiza remoção de duplicatas, conformidade com robots.txt, filtragem de segurança e filtragem de qualidade
- Remove conteúdos nocivos, como pornografia, violência e material de abuso sexual infantil (CSAM)

Implementação e sustentabilidade

Hardware: uso de TPU do Google
- Acelera o treinamento com processamento em larga escala e memória de alta largura de banda
- Garante escalabilidade e eficiência com treinamento distribuído por meio de TPU Pod
- Alinhado às metas de sustentabilidade do Google
Software: treinamento baseado em JAX e ML Pathways

Canais de distribuição

O Gemini 3 Pro é disponibilizado nas seguintes plataformas
- Gemini App, Google Cloud / Vertex AI, Google AI Studio, Gemini API, Google AI Mode, Google Antigravity
É fornecido em formato de API, sem exigência de hardware ou software adicional
O uso está sujeito aos termos de serviço e cláusulas adicionais de cada plataforma

Avaliação e desempenho

Escopo da avaliação: raciocínio, capacidade multimodal, uso de ferramentas, desempenho multilíngue e processamento de contexto longo
Resultado: o Gemini 3 Pro apresentou melhoria geral de desempenho em relação ao Gemini 2.5 Pro
- Houve avanços especialmente grandes em capacidade de raciocínio e processamento multimodal
Os resultados detalhados de benchmark podem ser consultados em deepmind.com/models/evals/gemini-3-pro

Finalidade de uso e limitações

Principais áreas de uso:
- Resolução de problemas complexos, trabalho criativo, planejamento estratégico e melhoria passo a passo
- Desempenho de agente, codificação avançada, compreensão de contexto longo e desenvolvimento de algoritmos
Limitações:
- Estão presentes limitações comuns de modelos de grande porte (ex.: alucinações)
- Podem ocorrer latência ou timeout ocasionais
- Corte de conhecimento: janeiro de 2025
Usos não permitidos:
- Atos ilegais ou perigosos, violação de segurança, conteúdo sexual, violento ou de ódio, geração de desinformação etc.
- Aplicação das políticas de uso proibido de IA generativa do Google

Ética e segurança de conteúdo

Processo de desenvolvimento: avaliações e testes de red team realizados em colaboração com equipes internas de segurança, proteção e responsabilidade
Tipos de avaliação
- Monitoramento contínuo por meio de avaliações automáticas e humanas
- Human Red Teaming com equipes externas especializadas
- Verificações de segurança em larga escala com Red Teaming automatizado
- Revisão ética e de segurança antes do lançamento
Políticas de segurança:
1. Bloqueio de conteúdo relacionado a exploração e abuso sexual infantil
2. Bloqueio de discurso de ódio
3. Bloqueio de conteúdo que incentive suicídio ou atos perigosos
4. Bloqueio de assédio e incitação à violência
5. Bloqueio de conteúdo sexualmente explícito
6. Bloqueio de aconselhamento médico contrário ao consenso científico

Resultados da avaliação de segurança

Resultados da avaliação automática (vs Gemini 2.5 Pro)
- Text-to-Text Safety: -10.4%
- Multilingual Safety: +0.2% (mudança não significativa)
- Image-to-Text Safety: +3.1% (mudança não significativa)
- Tone: +7.9%
- Unjustified Refusals: +3.7% (mudança não significativa)
Interpretação: no geral, houve melhorias em tom e segurança, com redução na taxa de recusas incorretas
Resultados de Human Red Teaming:
- Atende aos padrões de segurança infantil e apresentou desempenho de segurança equivalente ou melhor em relação ao Gemini 2.5 Pro
- Mesmo em testes expandidos para além das áreas de política, nenhum problema grave foi identificado

Riscos e mitigação

Principais riscos:
- Vulnerabilidade a jailbreak (melhorada, mas não totalmente resolvida)
- Possível degradação de qualidade em conversas com vários turnos
Medidas de mitigação:
- Filtragem de dados, pré-treinamento condicional, ajuste fino supervisionado e aprendizado por reforço com base em feedback humano e de críticos
- Aplicação de políticas de segurança e filtragem no nível do produto

Avaliação de Frontier Safety

Verificado com base no Google DeepMind Frontier Safety Framework (setembro de 2025)
Resultado: não atingiu nenhum Critical Capability Level (CCL)
- CBRN: insuficiente para elevar a capacidade de agentes de ameaça
- Cibersegurança: resolve algumas tarefas (11/12), mas não resolve tarefas de alta dificuldade (0/13)
- Manipulação nociva: sem aumento significativo em relação ao modelo anterior
- P&D em machine learning: melhor em relação ao Gemini 2.5, mas abaixo do limiar de alerta
- Risco de falso positivo, erro de julgamento e manipulação: permanece em nível baixo
Conclusão: ficou abaixo do limiar de risco nos critérios de Frontier Safety, com segurança assegurada

Resumo geral

O Gemini 3 Pro é o modelo multimodal de maior desempenho do Google, com melhorias em raciocínio, segurança e eficiência
O treinamento baseado em TPU e a estrutura MoE otimizam o processamento de dados em larga escala
Sistema reforçado de validação ética e de segurança, atendendo aos critérios do Frontier Safety Framework
Melhoria geral em relação ao Gemini 2.5 Pro, sendo avaliado como um modelo de IA seguro e escalável para uso no mundo real

1 comentários

GN⁺ 2025-11-19

Comentário do Hacker News

O comentário original foi movido para este tópico
encerrou agradecendo pela organização

Cartão do modelo Gemini 3 Pro

Visão geral do modelo

Dados de treinamento

Implementação e sustentabilidade

Canais de distribuição

Avaliação e desempenho

Finalidade de uso e limitações

Ética e segurança de conteúdo

Resultados da avaliação de segurança

Riscos e mitigação

Avaliação de Frontier Safety

Resumo geral

Leituras relacionadas

1 comentários

Comentário do Hacker News