OpenAI revela o GPT-4.5

xguru · 2025-02-28T09:19:15+09:00

O GPT-4.5 é o modelo mais recente da OpenAI, uma versão com escalabilidade aprimorada no pre-training e no post-training A ampliação da escala do aprendizado não supervisionado fortaleceu o reconhecimento de padrões e os insights criativos Permite conversas mais naturais, entende melhor a intenção do usuário e teve melhoria em inteligência emocional (EQ) Pode ser útil em várias tarefas, como escrita, programação e resolução de problemas Espera-se uma redução na taxa de alucinações Está sendo oferecido em formato de research preview, com o objetivo de explorar os pontos fortes e as limitações do modelo e reunir diversos casos de uso Expansão do aprendizado não supervisionado Para o avanço da IA, estão sendo ampliados dois eixos: aprendizado não supervisionado e raciocínio (reasoning) Reforço do raciocínio: o modelo foi treinado para pensar de forma sistemática na resolução de problemas complexos de STEM Modelos como OpenAI o1 e OpenAI o3-mini vêm desenvolvendo essa abordagem Expansão do aprendizado não supervisionado: mais dados aumentam a intuição do modelo e a precisão do seu conhecimento de mundo O GPT-4.5 foi treinado no supercomputador Microsoft Azure AI e passou a ter conhecimento mais amplo e compreensão mais profunda Com isso, reduz a ocorrência de alucinações e oferece resultados mais confiáveis em vários temas Expansão do paradigma GPT O GPT-4.5 possui conhecimento superior ao dos modelos anteriores Oferece insights mais profundos sobre perguntas históricas, como a origem das línguas Sobre perguntas como "Qual foi a primeira língua?": É bastante provável que não tenha existido uma única primeira língua Estima-se que a linguagem tenha surgido na África há mais de 100 mil anos É bem possível que proto-línguas tenham evoluído a partir de gestos, sons e sinais Como não há registros, não é possível saber com exatidão a origem da linguagem Dessa forma, o GPT-4.5 também pode fornecer respostas aprofundadas em áreas como linguística e história Conhecimento de mundo mais profundo Nos resultados da avaliação SimpleQA, o GPT-4.5 registrou precisão maior do que outros modelos Comparação de precisão (Accuracy): GPT-4.5: 62.5% GPT-4o: 38.2% OpenAI o1: 47% OpenAI o3-mini: 15% Comparação da taxa de alucinação (Hallucination Rate) (quanto menor, melhor): GPT-4.5: 37.1% GPT-4o: 61.8% OpenAI o1: 44% OpenAI o3-mini: 80.3% O GPT-4.5 mantém maior precisão e reduz a taxa de alucinação em perguntas que exigem verificação factual Treinamento para colaboração com humanos O GPT-4.5 foi treinado para entender melhor as demandas e intenções humanas Interpreta a intenção do usuário com mais refinamento e permite conversas naturais Em comparação com modelos anteriores, teve melhoria na inteligência emocional (EQ) e entende melhor nuances sutis Em tarefas de escrita e design, demonstra forte intuição criativa e senso estético Avaliação comparativa (Win-rate vs GPT-4o) Tarefas criativas: 56.8% Perguntas profissionais: 63.2% Perguntas do dia a dia: 57.0% O GPT-4.5 colabora de forma natural com humanos e identifica com mais precisão a intenção do usuário durante a conversa Perspectiva futura: capacidade de raciocínio mais poderosa O GPT-4.5 não é um modelo que raciocina logicamente antes de responder Trata-se de uma abordagem diferente da dos modelos centrados em raciocínio, como OpenAI o1 e OpenAI o3-mini Para os modelos do futuro, a expectativa é que a combinação entre pre-training e raciocínio (reasoning) seja o ponto central Reforço de segurança O GPT-4.5 foi treinado com novas técnicas de supervisão, incluindo SFT (ajuste fino supervisionado) e RLHF (aprendizado por reforço com feedback humano) Antes da implantação do modelo, foram realizados testes de segurança para avaliar riscos potenciais Foi divulgado um system card com os resultados da avaliação para incentivar pesquisa e feedback Como usar o GPT-4.5 no ChatGPT A partir de hoje, usuários do ChatGPT Pro podem selecionar o GPT-4.5 na web, no mobile e no desktop Na próxima semana, estará disponível para usuários Plus e Team Na semana seguinte, estará disponível para usuários Enterprise e Edu Principais recursos: Busca por informações atualizadas Suporte a upload de arquivos e imagens Uso do canvas para tarefas de escrita e programação No entanto, não há suporte para modo de voz, vídeo e compartilhamento de tela Como usar o GPT-4.5 na API Está disponível para desenvolvedores via Chat Completions API, Assistants API e Batch API Principais recursos: Function Calling Structured Outputs Streaming System Messages Suporte a capacidades de visão por meio de entrada de imagem Casos de uso para desenvolvedores: Aplicações em que inteligência emocional e criatividade são importantes (ex.: assistentes de escrita, coaching de estudo, brainstorming) Trabalhos complexos de código (ex.: workflows de codificação em múltiplas etapas, automação) Pontos a considerar sobre a oferta na API: O GPT-4.5 é um modelo com alto volume de processamento e custo elevado, portanto não substitui o GPT-4o A OpenAI ainda está avaliando se continuará oferecendo-o na API no longo prazo, e o feedback dos usuários é importante Conclusão O GPT-4.5 é um modelo que expande os limites do aprendizado não supervisionado, permitindo explorar capacidades criativas e novas funcionalidades A OpenAI explora novas possibilidades da tecnologia de IA e espera casos de uso inovadores por parte dos usuários.

(openai.com)

4 pontos por xguru 2025-02-28 | 4 comentários | Compartilhar no WhatsApp

O GPT-4.5 é o modelo mais recente da OpenAI, uma versão com escalabilidade aprimorada no pre-training e no post-training
A ampliação da escala do aprendizado não supervisionado fortaleceu o reconhecimento de padrões e os insights criativos
Permite conversas mais naturais, entende melhor a intenção do usuário e teve melhoria em inteligência emocional (EQ)
Pode ser útil em várias tarefas, como escrita, programação e resolução de problemas
Espera-se uma redução na taxa de alucinações
Está sendo oferecido em formato de research preview, com o objetivo de explorar os pontos fortes e as limitações do modelo e reunir diversos casos de uso

Expansão do aprendizado não supervisionado

Para o avanço da IA, estão sendo ampliados dois eixos: aprendizado não supervisionado e raciocínio (reasoning)
- Reforço do raciocínio: o modelo foi treinado para pensar de forma sistemática na resolução de problemas complexos de STEM
  - Modelos como OpenAI o1 e OpenAI o3-mini vêm desenvolvendo essa abordagem
- Expansão do aprendizado não supervisionado: mais dados aumentam a intuição do modelo e a precisão do seu conhecimento de mundo
O GPT-4.5 foi treinado no supercomputador Microsoft Azure AI e passou a ter conhecimento mais amplo e compreensão mais profunda
- Com isso, reduz a ocorrência de alucinações e oferece resultados mais confiáveis em vários temas

Expansão do paradigma GPT

O GPT-4.5 possui conhecimento superior ao dos modelos anteriores
- Oferece insights mais profundos sobre perguntas históricas, como a origem das línguas
- Sobre perguntas como "Qual foi a primeira língua?":
  - É bastante provável que não tenha existido uma única primeira língua
  - Estima-se que a linguagem tenha surgido na África há mais de 100 mil anos
  - É bem possível que proto-línguas tenham evoluído a partir de gestos, sons e sinais
  - Como não há registros, não é possível saber com exatidão a origem da linguagem
Dessa forma, o GPT-4.5 também pode fornecer respostas aprofundadas em áreas como linguística e história

Conhecimento de mundo mais profundo

Nos resultados da avaliação SimpleQA, o GPT-4.5 registrou precisão maior do que outros modelos
- Comparação de precisão (Accuracy):
  - GPT-4.5: 62.5%
  - GPT-4o: 38.2%
  - OpenAI o1: 47%
  - OpenAI o3-mini: 15%
- Comparação da taxa de alucinação (Hallucination Rate) (quanto menor, melhor):
  - GPT-4.5: 37.1%
  - GPT-4o: 61.8%
  - OpenAI o1: 44%
  - OpenAI o3-mini: 80.3%
O GPT-4.5 mantém maior precisão e reduz a taxa de alucinação em perguntas que exigem verificação factual

Treinamento para colaboração com humanos

O GPT-4.5 foi treinado para entender melhor as demandas e intenções humanas
- Interpreta a intenção do usuário com mais refinamento e permite conversas naturais
- Em comparação com modelos anteriores, teve melhoria na inteligência emocional (EQ) e entende melhor nuances sutis
- Em tarefas de escrita e design, demonstra forte intuição criativa e senso estético
Avaliação comparativa (Win-rate vs GPT-4o)
- Tarefas criativas: 56.8%
- Perguntas profissionais: 63.2%
- Perguntas do dia a dia: 57.0%
O GPT-4.5 colabora de forma natural com humanos e identifica com mais precisão a intenção do usuário durante a conversa

Perspectiva futura: capacidade de raciocínio mais poderosa

O GPT-4.5 não é um modelo que raciocina logicamente antes de responder
Trata-se de uma abordagem diferente da dos modelos centrados em raciocínio, como OpenAI o1 e OpenAI o3-mini
Para os modelos do futuro, a expectativa é que a combinação entre pre-training e raciocínio (reasoning) seja o ponto central

Reforço de segurança

O GPT-4.5 foi treinado com novas técnicas de supervisão, incluindo SFT (ajuste fino supervisionado) e RLHF (aprendizado por reforço com feedback humano)
Antes da implantação do modelo, foram realizados testes de segurança para avaliar riscos potenciais
Foi divulgado um system card com os resultados da avaliação para incentivar pesquisa e feedback

Como usar o GPT-4.5 no ChatGPT

A partir de hoje, usuários do ChatGPT Pro podem selecionar o GPT-4.5 na web, no mobile e no desktop
Na próxima semana, estará disponível para usuários Plus e Team
Na semana seguinte, estará disponível para usuários Enterprise e Edu
Principais recursos:
- Busca por informações atualizadas
- Suporte a upload de arquivos e imagens
- Uso do canvas para tarefas de escrita e programação
- No entanto, não há suporte para modo de voz, vídeo e compartilhamento de tela

Como usar o GPT-4.5 na API

Está disponível para desenvolvedores via Chat Completions API, Assistants API e Batch API
Principais recursos:
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- Suporte a capacidades de visão por meio de entrada de imagem
Casos de uso para desenvolvedores:
- Aplicações em que inteligência emocional e criatividade são importantes (ex.: assistentes de escrita, coaching de estudo, brainstorming)
- Trabalhos complexos de código (ex.: workflows de codificação em múltiplas etapas, automação)
Pontos a considerar sobre a oferta na API:
- O GPT-4.5 é um modelo com alto volume de processamento e custo elevado, portanto não substitui o GPT-4o
- A OpenAI ainda está avaliando se continuará oferecendo-o na API no longo prazo, e o feedback dos usuários é importante

Conclusão

O GPT-4.5 é um modelo que expande os limites do aprendizado não supervisionado, permitindo explorar capacidades criativas e novas funcionalidades
A OpenAI explora novas possibilidades da tecnologia de IA e espera casos de uso inovadores por parte dos usuários.

4 comentários

GN⁺ 2025-02-28

Comentários do Hacker News

O preço do GPT 4.5 é muito alto
- Entrada: $75.00 por 1 milhão de tokens
- Entrada em cache: $37.50 por 1 milhão de tokens
- Saída: $150.00 por 1 milhão de tokens
- A diferença de preço em comparação com o GPT 4o é grande
- O GPT-4.5 é um modelo muito grande e intensivo em computação, e a OpenAI ainda está avaliando se vai oferecê-lo pela API no longo prazo
- O feedback dos usuários é importante
Impressões sobre o uso do GPT-4.5
- Muito lento, não é adequado para interação em tempo real
- O estilo de escrita melhorou, está mais casual e acessível
- Na comparação de rascunhos de livro, a diferença entre GPT4o e GPT4.5 é perceptível
Foco em inteligência emocional (EQ)
- Há uma tendência de se transformar em um "amigo de IA simpático"
- Anthropic e Grok também estão seguindo nessa direção
- Espera-se que esse comportamento não se infiltre nas respostas da API
Decepção com a postagem no blog e a demonstração em live stream
- O novo modelo não impressiona
- Parece difícil para a OpenAI se manter à frente dos concorrentes
- O preço extremamente alto causa surpresa
Abordagens diferentes de OpenAI e Anthropic
- A Anthropic acredita que um único paradigma (raciocínio) pode servir para todos os casos de uso
- A OpenAI acredita que é necessário um ensemble de modelos com capacidades diversas
- O GPT 4.5 é maior, então pode armazenar mais dados factuais
Desempenho do GPT-4.5 no benchmark de LLM da Kagi
- Apesar do preço alto e da velocidade, o desempenho é excelente
- Em algumas tarefas, ainda deixa a desejar
Como usar o GPT-4.5 via API
- Pode ser executado com a ferramenta uvx
- É necessário configurar a chave da API
Comparação de desempenho em programação
- O ChatGPT 4.5 é um pouco melhor em programação do que o ChatGPT 4o
- O Anthropic Claude 3.7 apresenta desempenho melhor
Entendimento sobre a tentativa da OpenAI
- O GPT 4.5 foi uma tentativa importante para explorar as leis de escala do pré-treinamento
- É um presente que contribui para a ciência

xguru 2025-02-28

O preço do GPT-4.5 (por 1M de tokens)

$75 por entrada
$37,50 por entrada em cache
$150 por saída
Comparando com o 4o, a entrada é 30 vezes mais cara e a saída, 15 vezes.

Mas o desempenho não melhora nessa mesma proporção, então parece haver bastante insatisfação.

Ao usar o GPT-4.5 no Cursor, dizem que ele funciona de forma eficiente até em casos em que outros modelos falham.
Claro, é tão caro que é preciso pagar por uso. A reação foi algo como: "vou falir mandando ele fazer código complexo".
https://x.com/cursor_ai/status/1895210110714290302

bearmett 2025-02-28

Acho que tive um pensamento parecido ao ver o preço do Claude Code. Se você vive de salário, não é falência quando passa do seu valor por hora? 😵‍💫

botplaysdice 2025-02-28

Parece até que ainda bem, né. Dependendo do preço do modelo, o nosso valor também...;;;