14 pontos por GN⁺ 2025-08-08 | Ainda não há comentários. | Compartilhar no WhatsApp
  • GPT-5 oferece desempenho superior aos modelos anteriores em todas as áreas, como programação, matemática, escrita, saúde e percepção visual, com um sistema integrado que combina respostas rápidas e raciocínio profundo conforme o contexto
  • ‘GPT-5 Thinking’ aplica raciocínio mais longo a problemas complexos para aumentar a precisão, e usuários do plano Pro podem usar o GPT-5 Pro, uma versão expandida, para obter o mais alto nível de desempenho
  • No uso real, reduziu significativamente a taxa de alucinações (geração de fatos incorretos), além de melhorar a compreensão multimodal, a execução de instruções e a capacidade de lidar com tarefas complexas envolvendo ferramentas
  • O suporte a desenvolvedores foi reforçado em áreas como geração de UI frontend e depuração em larga escala, e na área de saúde atingiu a maior pontuação no HealthBench, atuando como um parceiro de saúde mais ativo
  • Em segurança, introduziu o treinamento de ‘safe completion’ (conclusão segura) para reduzir recusas desnecessárias e conta com um sistema de múltiplas defesas de alto nível nas áreas de biologia e química

Visão geral do GPT-5

Sistema integrado

  • Um único sistema inclui um modelo inteligente e eficiente, um modelo de raciocínio profundo (GPT-5 Thinking) e um roteador em tempo real que escolhe entre eles conforme a situação, a complexidade, a necessidade de ferramentas e a intenção do usuário
  • Quando o limite de uso é excedido, as versões ‘mini’ de cada modelo passam a atender as consultas restantes
  • No futuro, esses recursos serão integrados em um único modelo

Melhorias de desempenho e usabilidade

  • Desempenho amplamente superior ao GPT-4o em diversos benchmarks
  • Redução de alucinações, melhor execução de instruções e minimização de respostas bajuladoras (sycophancy)
  • Melhoria em três áreas principais
    • Programação: fortalecimento da capacidade de gerar interfaces frontend complexas, depurar grandes repositórios e criar UI/UX com senso estético
    • Escrita: capacidade de lidar com ambiguidades estruturais e produzir textos com profundidade literária e ritmo, além de melhor suporte para redação e edição de documentos do dia a dia
    • Saúde: recorde no HealthBench, com respostas seguras e precisas ajustadas ao contexto, ao nível de conhecimento e à região

Resultados de avaliação

  • Matemática 94.6% (AIME 2025), programação 74.9% no SWE-bench Verified, multimodal 84.2% no MMMU, saúde 46.2% no HealthBench Hard, alcançando SOTA
  • No GPQA, o GPT-5 Pro registrou o melhor resultado, com 88.4%
  • Grande melhoria na capacidade de lidar com multimodalidade, integração com ferramentas e tarefas em múltiplas etapas

Raciocínio eficiente

  • Redução de 50~80% no uso de tokens para o mesmo nível de desempenho
  • Em tarefas complexas e de alta dificuldade, o GPT-5 Thinking reduz de forma significativa a taxa de erros e de alucinações em comparação com o o3

Maior confiabilidade e factualidade

  • Em testes abertos de factualidade, a taxa de alucinação caiu 6 vezes
  • Explica com clareza suas limitações em tarefas impossíveis ou quando faltam informações
  • A taxa de respostas sycophantic caiu de 14.5% para menos de 6%

Melhorias de segurança

  • O treinamento de ‘safe completion’ (conclusão segura) permite fornecer respostas seguras e úteis mesmo para solicitações com potencial de risco
  • Aplicação de um sistema de múltiplas defesas para cenários de alto risco nas áreas de biologia e química

GPT-5 Pro

  • Modelo de raciocínio expandido para tarefas do mais alto nível de dificuldade
  • Em avaliações com especialistas, teve 67.8% de preferência sobre o GPT-5 Thinking e reduziu erros principais em 22%
  • Melhor desempenho em saúde, ciência, matemática e programação

Como usar e acesso

  • O GPT-5 passa a ser o modelo padrão do ChatGPT, substituindo modelos anteriores (GPT-4o, o3 etc.)
  • É possível forçar o modo de raciocínio ao inserir ‘think hard about this’
  • Disponibilização gradual para Plus·Pro·Team·Free, com Enterprise·Edu recebendo uma semana depois
  • Usuários gratuitos mudam para GPT-5 mini ao excederem o limite

Principais pontos do GPT-5 para desenvolvedores

Desempenho e características

  • Desempenho em programação:

    • SWE-bench Verified 74.9% (o3: 69.1%), uso de tokens 22%↓, chamadas de ferramentas 45%↓
    • 88% no Aider polyglot, com redução de 1/3 na taxa de erros ao modificar código
    • 70% de preferência sobre o o3 em geração de código frontend
  • Tarefas de agente:

    • τ 2-bench telecom 96.7%, com melhor estabilidade em chamadas de múltiplas ferramentas e chamadas paralelas
    • Pode emitir mensagens de preâmbulo mostrando de forma visível ao usuário o progresso e o plano
  • Contexto longo:

    • OpenAI-MRCR(2 needle 128k) 95.2%, BrowseComp Long Context(256k) 88.8%
    • Processa contexto de até 400 mil tokens

Novos recursos de API

  • reasoning_effort: ajusta o tempo de raciocínio na faixa de minimal~high
  • verbosity: define o comprimento padrão da resposta na faixa de low~high
  • Ferramentas customizadas: chamadas em plaintext em vez de JSON, com suporte a restrições por regex/gramática
  • Ferramentas nativas integradas, como chamadas paralelas de ferramentas, busca na web, busca de arquivos e geração de imagens
  • Suporte a recursos de redução de custo como prompt caching e Batch API

Estabilidade e confiabilidade

  • Nos benchmarks LongFact e FactScore, a taxa de alucinação foi reduzida em ~80% em comparação com o o3
  • Melhor reconhecimento das próprias limitações e capacidade reforçada de lidar com situações inesperadas
  • Adequado para tarefas de alto risco e que exigem precisão (código, dados e tomada de decisão)

Availability & pricing

Tamanhos disponíveis e endpoints

  • Versões disponíveis: gpt-5, gpt-5-mini, gpt-5-nano
  • Interfaces compatíveis: Responses API, Chat Completions API e Codex CLI como padrão
  • Característica dos modelos: a família GPT‑5 na API é composta por modelos de reasoning, enquanto o modelo non‑reasoning do ChatGPT é oferecido com um ID separado

Tabela de preços e unidade de cobrança

  • gpt-5: entrada $1.25/milhão de tokens, saída $10/milhão de tokens
  • gpt-5-mini: entrada $0.25/milhão, saída $2/milhão
  • gpt-5-nano: entrada $0.05/milhão, saída $0.40/milhão
  • gpt-5-chat-latest (sem raciocínio): entrada $1.25/milhão, saída $10/milhão, igual ao gpt-5

Resumo dos recursos suportados

  • Controle de raciocínio: em reasoning_effort, é possível definir minimal·low·medium·high para ajustar o trade-off entre velocidade↔precisão
  • Comprimento da resposta: verbosity define a tendência padrão para respostas curtas/padrão/longas
  • Tooling: custom tools permitem chamadas com argumentos em plaintext e aplicação de restrições regex/CFG
  • Recursos de execução: suporte a chamadas paralelas de ferramentas, ferramentas nativas (web search, file search, image generation etc.), streaming e Structured Outputs
  • Otimização de custo: prompt caching e Batch API reduzem custos de tokens e latência
  • Canais de implantação: o GPT‑5 será aplicado em Microsoft 365 Copilot, Copilot, GitHub Copilot e Azure AI Foundry

Exemplo simples de custo

  • Ao processar 50k tokens de entrada + 5k de saída com gpt-5, o custo total é de ≈ $0.1125
    • Cálculo: entrada 0.05M × $1.25 = $0.0625, saída 0.005M × $10 = $0.05, total $0.1125
  • Ao processar a mesma tarefa com gpt-5-mini, o custo total é de ≈ $0.0175
    • Entrada 0.05M × $0.25 = $0.0125, saída 0.005M × $2 = $0.01, o total correto é $0.0225, mas, considerando o preço da saída, a diferença cresce ainda mais em cargas de trabalho com maior peso na entrada
  • Pipelines com grande volume de saída gerativa tendem a se beneficiar mais de modelos com menor custo de saída

Nota de guia para escolha

  • Se a precisão é a prioridade máxima e for necessário um encadeamento complexo de ferramentas, vale considerar gpt-5 para agentes de backend
  • Para edição cotidiana de código, agentes leves e processamento em lote em grande volume, o gpt-5-mini oferece melhor equilíbrio entre custo e qualidade
  • Para pré-processamento, checagem de regras e resumos simples com latência ultrabaixa e custo ultrabaixo, o gpt-5-nano é adequado

Referência

  • Se quiser usar na API o modelo padrão non‑reasoning do ChatGPT, escolha gpt-5-chat-latest
  • Como instruções explícitas têm prioridade sobre o comprimento padrão, mesmo com verbosity, se você pedir algo específico como “ensaio de 5 parágrafos”, o modelo seguirá a instrução

Ainda não há comentários.

Ainda não há comentários.