Lançamento do GPT-5.2

fortune · 2025-12-12T12:00:49+09:00

[GPT-5.1 thinking -> GPT-5.2 thinking] Tarefa de planilha de banco de investimento (interna): 59.1% → 68.4% Tarefa de modelagem de planilhas com 3 demonstrações financeiras/LBO SWE-Bench Pro (público): 50.8% → 55.6% Aplicação de patches em repositórios (repo) reais em 4 linguagens OpenAI MRCRv2 (8 agulhas, 128k–256k): 29.6% → 77.0% Encontrar e reproduzir informações em documentos muito longos ScreenSpot Pro (incluindo Python): 64.2% → 86.3% Entender capturas de tela de UI e responder a perguntas ARC-AGI-2 (verificado): 17.6% → 52.9% Quebra-cabeças difíceis de raciocínio abstrato (verificado)

(openai.com)

3 pontos por fortune 2025-12-12 | Ainda não há comentários. | Compartilhar no WhatsApp

[GPT-5.1 thinking -> GPT-5.2 thinking]

Tarefa de planilha de banco de investimento (interna): 59.1% → 68.4%
- Tarefa de modelagem de planilhas com 3 demonstrações financeiras/LBO
SWE-Bench Pro (público): 50.8% → 55.6%
- Aplicação de patches em repositórios (repo) reais em 4 linguagens
OpenAI MRCRv2 (8 agulhas, 128k–256k): 29.6% → 77.0%
- Encontrar e reproduzir informações em documentos muito longos
ScreenSpot Pro (incluindo Python): 64.2% → 86.3%
- Entender capturas de tela de UI e responder a perguntas
ARC-AGI-2 (verificado): 17.6% → 52.9%
- Quebra-cabeças difíceis de raciocínio abstrato (verificado)

Lançamento do GPT-5.2

Leituras relacionadas

Ainda não há comentários.