Lançamento do GPT-5
(openai.com)- GPT-5 oferece desempenho superior aos modelos anteriores em todas as áreas, como programação, matemática, escrita, saúde e percepção visual, com um sistema integrado que combina respostas rápidas e raciocínio profundo conforme o contexto
- ‘GPT-5 Thinking’ aplica raciocínio mais longo a problemas complexos para aumentar a precisão, e usuários do plano Pro podem usar o GPT-5 Pro, uma versão expandida, para obter o mais alto nível de desempenho
- No uso real, reduziu significativamente a taxa de alucinações (geração de fatos incorretos), além de melhorar a compreensão multimodal, a execução de instruções e a capacidade de lidar com tarefas complexas envolvendo ferramentas
- O suporte a desenvolvedores foi reforçado em áreas como geração de UI frontend e depuração em larga escala, e na área de saúde atingiu a maior pontuação no HealthBench, atuando como um parceiro de saúde mais ativo
- Em segurança, introduziu o treinamento de ‘safe completion’ (conclusão segura) para reduzir recusas desnecessárias e conta com um sistema de múltiplas defesas de alto nível nas áreas de biologia e química
Visão geral do GPT-5
Sistema integrado
- Um único sistema inclui um modelo inteligente e eficiente, um modelo de raciocínio profundo (GPT-5 Thinking) e um roteador em tempo real que escolhe entre eles conforme a situação, a complexidade, a necessidade de ferramentas e a intenção do usuário
- Quando o limite de uso é excedido, as versões ‘mini’ de cada modelo passam a atender as consultas restantes
- No futuro, esses recursos serão integrados em um único modelo
Melhorias de desempenho e usabilidade
- Desempenho amplamente superior ao GPT-4o em diversos benchmarks
- Redução de alucinações, melhor execução de instruções e minimização de respostas bajuladoras (sycophancy)
- Melhoria em três áreas principais
- Programação: fortalecimento da capacidade de gerar interfaces frontend complexas, depurar grandes repositórios e criar UI/UX com senso estético
- Escrita: capacidade de lidar com ambiguidades estruturais e produzir textos com profundidade literária e ritmo, além de melhor suporte para redação e edição de documentos do dia a dia
- Saúde: recorde no HealthBench, com respostas seguras e precisas ajustadas ao contexto, ao nível de conhecimento e à região
Resultados de avaliação
- Matemática 94.6% (AIME 2025), programação 74.9% no SWE-bench Verified, multimodal 84.2% no MMMU, saúde 46.2% no HealthBench Hard, alcançando SOTA
- No GPQA, o GPT-5 Pro registrou o melhor resultado, com 88.4%
- Grande melhoria na capacidade de lidar com multimodalidade, integração com ferramentas e tarefas em múltiplas etapas
Raciocínio eficiente
- Redução de 50~80% no uso de tokens para o mesmo nível de desempenho
- Em tarefas complexas e de alta dificuldade, o GPT-5 Thinking reduz de forma significativa a taxa de erros e de alucinações em comparação com o o3
Maior confiabilidade e factualidade
- Em testes abertos de factualidade, a taxa de alucinação caiu 6 vezes
- Explica com clareza suas limitações em tarefas impossíveis ou quando faltam informações
- A taxa de respostas sycophantic caiu de 14.5% para menos de 6%
Melhorias de segurança
- O treinamento de ‘safe completion’ (conclusão segura) permite fornecer respostas seguras e úteis mesmo para solicitações com potencial de risco
- Aplicação de um sistema de múltiplas defesas para cenários de alto risco nas áreas de biologia e química
GPT-5 Pro
- Modelo de raciocínio expandido para tarefas do mais alto nível de dificuldade
- Em avaliações com especialistas, teve 67.8% de preferência sobre o GPT-5 Thinking e reduziu erros principais em 22%
- Melhor desempenho em saúde, ciência, matemática e programação
Como usar e acesso
- O GPT-5 passa a ser o modelo padrão do ChatGPT, substituindo modelos anteriores (GPT-4o, o3 etc.)
- É possível forçar o modo de raciocínio ao inserir ‘think hard about this’
- Disponibilização gradual para Plus·Pro·Team·Free, com Enterprise·Edu recebendo uma semana depois
- Usuários gratuitos mudam para GPT-5 mini ao excederem o limite
Principais pontos do GPT-5 para desenvolvedores
Desempenho e características
-
Desempenho em programação:
- SWE-bench Verified 74.9% (o3: 69.1%), uso de tokens 22%↓, chamadas de ferramentas 45%↓
- 88% no Aider polyglot, com redução de 1/3 na taxa de erros ao modificar código
- 70% de preferência sobre o o3 em geração de código frontend
-
Tarefas de agente:
- τ 2-bench telecom 96.7%, com melhor estabilidade em chamadas de múltiplas ferramentas e chamadas paralelas
- Pode emitir mensagens de preâmbulo mostrando de forma visível ao usuário o progresso e o plano
-
Contexto longo:
- OpenAI-MRCR(2 needle 128k) 95.2%, BrowseComp Long Context(256k) 88.8%
- Processa contexto de até 400 mil tokens
Novos recursos de API
reasoning_effort: ajusta o tempo de raciocínio na faixa deminimal~highverbosity: define o comprimento padrão da resposta na faixa delow~high- Ferramentas customizadas: chamadas em plaintext em vez de JSON, com suporte a restrições por regex/gramática
- Ferramentas nativas integradas, como chamadas paralelas de ferramentas, busca na web, busca de arquivos e geração de imagens
- Suporte a recursos de redução de custo como prompt caching e Batch API
Estabilidade e confiabilidade
- Nos benchmarks LongFact e FactScore, a taxa de alucinação foi reduzida em ~80% em comparação com o o3
- Melhor reconhecimento das próprias limitações e capacidade reforçada de lidar com situações inesperadas
- Adequado para tarefas de alto risco e que exigem precisão (código, dados e tomada de decisão)
Availability & pricing
Tamanhos disponíveis e endpoints
- Versões disponíveis:
gpt-5,gpt-5-mini,gpt-5-nano - Interfaces compatíveis: Responses API, Chat Completions API e Codex CLI como padrão
- Característica dos modelos: a família GPT‑5 na API é composta por modelos de reasoning, enquanto o modelo non‑reasoning do ChatGPT é oferecido com um ID separado
Tabela de preços e unidade de cobrança
gpt-5: entrada $1.25/milhão de tokens, saída $10/milhão de tokensgpt-5-mini: entrada $0.25/milhão, saída $2/milhãogpt-5-nano: entrada $0.05/milhão, saída $0.40/milhãogpt-5-chat-latest(sem raciocínio): entrada $1.25/milhão, saída $10/milhão, igual aogpt-5
Resumo dos recursos suportados
- Controle de raciocínio: em
reasoning_effort, é possível definirminimal·low·medium·highpara ajustar o trade-off entre velocidade↔precisão - Comprimento da resposta:
verbositydefine a tendência padrão para respostas curtas/padrão/longas - Tooling: custom tools permitem chamadas com argumentos em plaintext e aplicação de restrições regex/CFG
- Recursos de execução: suporte a chamadas paralelas de ferramentas, ferramentas nativas (web search, file search, image generation etc.), streaming e Structured Outputs
- Otimização de custo: prompt caching e Batch API reduzem custos de tokens e latência
- Canais de implantação: o GPT‑5 será aplicado em Microsoft 365 Copilot, Copilot, GitHub Copilot e Azure AI Foundry
Exemplo simples de custo
- Ao processar 50k tokens de entrada + 5k de saída com
gpt-5, o custo total é de ≈ $0.1125- Cálculo: entrada 0.05M × $1.25 = $0.0625, saída 0.005M × $10 = $0.05, total $0.1125
- Ao processar a mesma tarefa com
gpt-5-mini, o custo total é de ≈ $0.0175- Entrada 0.05M × $0.25 = $0.0125, saída 0.005M × $2 = $0.01, o total correto é $0.0225, mas, considerando o preço da saída, a diferença cresce ainda mais em cargas de trabalho com maior peso na entrada
- Pipelines com grande volume de saída gerativa tendem a se beneficiar mais de modelos com menor custo de saída
Nota de guia para escolha
- Se a precisão é a prioridade máxima e for necessário um encadeamento complexo de ferramentas, vale considerar
gpt-5para agentes de backend - Para edição cotidiana de código, agentes leves e processamento em lote em grande volume, o
gpt-5-minioferece melhor equilíbrio entre custo e qualidade - Para pré-processamento, checagem de regras e resumos simples com latência ultrabaixa e custo ultrabaixo, o
gpt-5-nanoé adequado
Referência
- Se quiser usar na API o modelo padrão non‑reasoning do ChatGPT, escolha
gpt-5-chat-latest - Como instruções explícitas têm prioridade sobre o comprimento padrão, mesmo com
verbosity, se você pedir algo específico como “ensaio de 5 parágrafos”, o modelo seguirá a instrução
Ainda não há comentários.