- O GPT-4.5 é o modelo mais recente da OpenAI, uma versão com escalabilidade aprimorada no pre-training e no post-training
- A ampliação da escala do aprendizado não supervisionado fortaleceu o reconhecimento de padrões e os insights criativos
- Permite conversas mais naturais, entende melhor a intenção do usuário e teve melhoria em inteligência emocional (EQ)
- Pode ser útil em várias tarefas, como escrita, programação e resolução de problemas
- Espera-se uma redução na taxa de alucinações
- Está sendo oferecido em formato de research preview, com o objetivo de explorar os pontos fortes e as limitações do modelo e reunir diversos casos de uso
Expansão do aprendizado não supervisionado
- Para o avanço da IA, estão sendo ampliados dois eixos: aprendizado não supervisionado e raciocínio (reasoning)
- Reforço do raciocínio: o modelo foi treinado para pensar de forma sistemática na resolução de problemas complexos de STEM
- Modelos como OpenAI o1 e OpenAI o3-mini vêm desenvolvendo essa abordagem
- Expansão do aprendizado não supervisionado: mais dados aumentam a intuição do modelo e a precisão do seu conhecimento de mundo
- O GPT-4.5 foi treinado no supercomputador Microsoft Azure AI e passou a ter conhecimento mais amplo e compreensão mais profunda
- Com isso, reduz a ocorrência de alucinações e oferece resultados mais confiáveis em vários temas
Expansão do paradigma GPT
- O GPT-4.5 possui conhecimento superior ao dos modelos anteriores
- Oferece insights mais profundos sobre perguntas históricas, como a origem das línguas
- Sobre perguntas como "Qual foi a primeira língua?":
- É bastante provável que não tenha existido uma única primeira língua
- Estima-se que a linguagem tenha surgido na África há mais de 100 mil anos
- É bem possível que proto-línguas tenham evoluído a partir de gestos, sons e sinais
- Como não há registros, não é possível saber com exatidão a origem da linguagem
- Dessa forma, o GPT-4.5 também pode fornecer respostas aprofundadas em áreas como linguística e história
Conhecimento de mundo mais profundo
- Nos resultados da avaliação SimpleQA, o GPT-4.5 registrou precisão maior do que outros modelos
- Comparação de precisão (Accuracy):
- GPT-4.5: 62.5%
- GPT-4o: 38.2%
- OpenAI o1: 47%
- OpenAI o3-mini: 15%
- Comparação da taxa de alucinação (Hallucination Rate) (quanto menor, melhor):
- GPT-4.5: 37.1%
- GPT-4o: 61.8%
- OpenAI o1: 44%
- OpenAI o3-mini: 80.3%
- O GPT-4.5 mantém maior precisão e reduz a taxa de alucinação em perguntas que exigem verificação factual
Treinamento para colaboração com humanos
- O GPT-4.5 foi treinado para entender melhor as demandas e intenções humanas
- Interpreta a intenção do usuário com mais refinamento e permite conversas naturais
- Em comparação com modelos anteriores, teve melhoria na inteligência emocional (EQ) e entende melhor nuances sutis
- Em tarefas de escrita e design, demonstra forte intuição criativa e senso estético
- Avaliação comparativa (Win-rate vs GPT-4o)
- Tarefas criativas: 56.8%
- Perguntas profissionais: 63.2%
- Perguntas do dia a dia: 57.0%
- O GPT-4.5 colabora de forma natural com humanos e identifica com mais precisão a intenção do usuário durante a conversa
Perspectiva futura: capacidade de raciocínio mais poderosa
- O GPT-4.5 não é um modelo que raciocina logicamente antes de responder
- Trata-se de uma abordagem diferente da dos modelos centrados em raciocínio, como OpenAI o1 e OpenAI o3-mini
- Para os modelos do futuro, a expectativa é que a combinação entre pre-training e raciocínio (reasoning) seja o ponto central
Reforço de segurança
- O GPT-4.5 foi treinado com novas técnicas de supervisão, incluindo SFT (ajuste fino supervisionado) e RLHF (aprendizado por reforço com feedback humano)
- Antes da implantação do modelo, foram realizados testes de segurança para avaliar riscos potenciais
- Foi divulgado um system card com os resultados da avaliação para incentivar pesquisa e feedback
Como usar o GPT-4.5 no ChatGPT
- A partir de hoje, usuários do ChatGPT Pro podem selecionar o GPT-4.5 na web, no mobile e no desktop
- Na próxima semana, estará disponível para usuários Plus e Team
- Na semana seguinte, estará disponível para usuários Enterprise e Edu
- Principais recursos:
- Busca por informações atualizadas
- Suporte a upload de arquivos e imagens
- Uso do canvas para tarefas de escrita e programação
- No entanto, não há suporte para modo de voz, vídeo e compartilhamento de tela
Como usar o GPT-4.5 na API
- Está disponível para desenvolvedores via Chat Completions API, Assistants API e Batch API
- Principais recursos:
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- Suporte a capacidades de visão por meio de entrada de imagem
- Casos de uso para desenvolvedores:
- Aplicações em que inteligência emocional e criatividade são importantes (ex.: assistentes de escrita, coaching de estudo, brainstorming)
- Trabalhos complexos de código (ex.: workflows de codificação em múltiplas etapas, automação)
- Pontos a considerar sobre a oferta na API:
- O GPT-4.5 é um modelo com alto volume de processamento e custo elevado, portanto não substitui o GPT-4o
- A OpenAI ainda está avaliando se continuará oferecendo-o na API no longo prazo, e o feedback dos usuários é importante
Conclusão
- O GPT-4.5 é um modelo que expande os limites do aprendizado não supervisionado, permitindo explorar capacidades criativas e novas funcionalidades
- A OpenAI explora novas possibilidades da tecnologia de IA e espera casos de uso inovadores por parte dos usuários.
4 comentários
Comentários do Hacker News
O preço do GPT 4.5 é muito alto
Impressões sobre o uso do GPT-4.5
Foco em inteligência emocional (EQ)
Decepção com a postagem no blog e a demonstração em live stream
Abordagens diferentes de OpenAI e Anthropic
Desempenho do GPT-4.5 no benchmark de LLM da Kagi
Como usar o GPT-4.5 via API
uvxComparação de desempenho em programação
Entendimento sobre a tentativa da OpenAI
O preço do GPT-4.5 (por 1M de tokens)
Comparando com o 4o, a entrada é 30 vezes mais cara e a saída, 15 vezes.
Mas o desempenho não melhora nessa mesma proporção, então parece haver bastante insatisfação.
Ao usar o GPT-4.5 no Cursor, dizem que ele funciona de forma eficiente até em casos em que outros modelos falham.
Claro, é tão caro que é preciso pagar por uso. A reação foi algo como: "vou falir mandando ele fazer código complexo".
https://x.com/cursor_ai/status/1895210110714290302
Acho que tive um pensamento parecido ao ver o preço do Claude Code. Se você vive de salário, não é falência quando passa do seu valor por hora? 😵💫
Parece até que ainda bem, né. Dependendo do preço do modelo, o nosso valor também...;;;