4 pontos por xguru 2025-02-28 | 4 comentários | Compartilhar no WhatsApp
  • O GPT-4.5 é o modelo mais recente da OpenAI, uma versão com escalabilidade aprimorada no pre-training e no post-training
  • A ampliação da escala do aprendizado não supervisionado fortaleceu o reconhecimento de padrões e os insights criativos
  • Permite conversas mais naturais, entende melhor a intenção do usuário e teve melhoria em inteligência emocional (EQ)
  • Pode ser útil em várias tarefas, como escrita, programação e resolução de problemas
  • Espera-se uma redução na taxa de alucinações
  • Está sendo oferecido em formato de research preview, com o objetivo de explorar os pontos fortes e as limitações do modelo e reunir diversos casos de uso

Expansão do aprendizado não supervisionado

  • Para o avanço da IA, estão sendo ampliados dois eixos: aprendizado não supervisionado e raciocínio (reasoning)
    • Reforço do raciocínio: o modelo foi treinado para pensar de forma sistemática na resolução de problemas complexos de STEM
      • Modelos como OpenAI o1 e OpenAI o3-mini vêm desenvolvendo essa abordagem
    • Expansão do aprendizado não supervisionado: mais dados aumentam a intuição do modelo e a precisão do seu conhecimento de mundo
  • O GPT-4.5 foi treinado no supercomputador Microsoft Azure AI e passou a ter conhecimento mais amplo e compreensão mais profunda
    • Com isso, reduz a ocorrência de alucinações e oferece resultados mais confiáveis em vários temas

Expansão do paradigma GPT

  • O GPT-4.5 possui conhecimento superior ao dos modelos anteriores
    • Oferece insights mais profundos sobre perguntas históricas, como a origem das línguas
    • Sobre perguntas como "Qual foi a primeira língua?":
      • É bastante provável que não tenha existido uma única primeira língua
      • Estima-se que a linguagem tenha surgido na África há mais de 100 mil anos
      • É bem possível que proto-línguas tenham evoluído a partir de gestos, sons e sinais
      • Como não há registros, não é possível saber com exatidão a origem da linguagem
  • Dessa forma, o GPT-4.5 também pode fornecer respostas aprofundadas em áreas como linguística e história

Conhecimento de mundo mais profundo

  • Nos resultados da avaliação SimpleQA, o GPT-4.5 registrou precisão maior do que outros modelos
    • Comparação de precisão (Accuracy):
      • GPT-4.5: 62.5%
      • GPT-4o: 38.2%
      • OpenAI o1: 47%
      • OpenAI o3-mini: 15%
    • Comparação da taxa de alucinação (Hallucination Rate) (quanto menor, melhor):
      • GPT-4.5: 37.1%
      • GPT-4o: 61.8%
      • OpenAI o1: 44%
      • OpenAI o3-mini: 80.3%
  • O GPT-4.5 mantém maior precisão e reduz a taxa de alucinação em perguntas que exigem verificação factual

Treinamento para colaboração com humanos

  • O GPT-4.5 foi treinado para entender melhor as demandas e intenções humanas
    • Interpreta a intenção do usuário com mais refinamento e permite conversas naturais
    • Em comparação com modelos anteriores, teve melhoria na inteligência emocional (EQ) e entende melhor nuances sutis
    • Em tarefas de escrita e design, demonstra forte intuição criativa e senso estético
  • Avaliação comparativa (Win-rate vs GPT-4o)
    • Tarefas criativas: 56.8%
    • Perguntas profissionais: 63.2%
    • Perguntas do dia a dia: 57.0%
  • O GPT-4.5 colabora de forma natural com humanos e identifica com mais precisão a intenção do usuário durante a conversa

Perspectiva futura: capacidade de raciocínio mais poderosa

  • O GPT-4.5 não é um modelo que raciocina logicamente antes de responder
  • Trata-se de uma abordagem diferente da dos modelos centrados em raciocínio, como OpenAI o1 e OpenAI o3-mini
  • Para os modelos do futuro, a expectativa é que a combinação entre pre-training e raciocínio (reasoning) seja o ponto central

Reforço de segurança

  • O GPT-4.5 foi treinado com novas técnicas de supervisão, incluindo SFT (ajuste fino supervisionado) e RLHF (aprendizado por reforço com feedback humano)
  • Antes da implantação do modelo, foram realizados testes de segurança para avaliar riscos potenciais
  • Foi divulgado um system card com os resultados da avaliação para incentivar pesquisa e feedback

Como usar o GPT-4.5 no ChatGPT

  • A partir de hoje, usuários do ChatGPT Pro podem selecionar o GPT-4.5 na web, no mobile e no desktop
  • Na próxima semana, estará disponível para usuários Plus e Team
  • Na semana seguinte, estará disponível para usuários Enterprise e Edu
  • Principais recursos:
    • Busca por informações atualizadas
    • Suporte a upload de arquivos e imagens
    • Uso do canvas para tarefas de escrita e programação
    • No entanto, não há suporte para modo de voz, vídeo e compartilhamento de tela

Como usar o GPT-4.5 na API

  • Está disponível para desenvolvedores via Chat Completions API, Assistants API e Batch API
  • Principais recursos:
    • Function Calling
    • Structured Outputs
    • Streaming
    • System Messages
    • Suporte a capacidades de visão por meio de entrada de imagem
  • Casos de uso para desenvolvedores:
    • Aplicações em que inteligência emocional e criatividade são importantes (ex.: assistentes de escrita, coaching de estudo, brainstorming)
    • Trabalhos complexos de código (ex.: workflows de codificação em múltiplas etapas, automação)
  • Pontos a considerar sobre a oferta na API:
    • O GPT-4.5 é um modelo com alto volume de processamento e custo elevado, portanto não substitui o GPT-4o
    • A OpenAI ainda está avaliando se continuará oferecendo-o na API no longo prazo, e o feedback dos usuários é importante

Conclusão

  • O GPT-4.5 é um modelo que expande os limites do aprendizado não supervisionado, permitindo explorar capacidades criativas e novas funcionalidades
  • A OpenAI explora novas possibilidades da tecnologia de IA e espera casos de uso inovadores por parte dos usuários.

4 comentários

 
GN⁺ 2025-02-28

Comentários do Hacker News

  • O preço do GPT 4.5 é muito alto

    • Entrada: $75.00 por 1 milhão de tokens
    • Entrada em cache: $37.50 por 1 milhão de tokens
    • Saída: $150.00 por 1 milhão de tokens
    • A diferença de preço em comparação com o GPT 4o é grande
    • O GPT-4.5 é um modelo muito grande e intensivo em computação, e a OpenAI ainda está avaliando se vai oferecê-lo pela API no longo prazo
    • O feedback dos usuários é importante
  • Impressões sobre o uso do GPT-4.5

    • Muito lento, não é adequado para interação em tempo real
    • O estilo de escrita melhorou, está mais casual e acessível
    • Na comparação de rascunhos de livro, a diferença entre GPT4o e GPT4.5 é perceptível
  • Foco em inteligência emocional (EQ)

    • Há uma tendência de se transformar em um "amigo de IA simpático"
    • Anthropic e Grok também estão seguindo nessa direção
    • Espera-se que esse comportamento não se infiltre nas respostas da API
  • Decepção com a postagem no blog e a demonstração em live stream

    • O novo modelo não impressiona
    • Parece difícil para a OpenAI se manter à frente dos concorrentes
    • O preço extremamente alto causa surpresa
  • Abordagens diferentes de OpenAI e Anthropic

    • A Anthropic acredita que um único paradigma (raciocínio) pode servir para todos os casos de uso
    • A OpenAI acredita que é necessário um ensemble de modelos com capacidades diversas
    • O GPT 4.5 é maior, então pode armazenar mais dados factuais
  • Desempenho do GPT-4.5 no benchmark de LLM da Kagi

    • Apesar do preço alto e da velocidade, o desempenho é excelente
    • Em algumas tarefas, ainda deixa a desejar
  • Como usar o GPT-4.5 via API

    • Pode ser executado com a ferramenta uvx
    • É necessário configurar a chave da API
  • Comparação de desempenho em programação

    • O ChatGPT 4.5 é um pouco melhor em programação do que o ChatGPT 4o
    • O Anthropic Claude 3.7 apresenta desempenho melhor
  • Entendimento sobre a tentativa da OpenAI

    • O GPT 4.5 foi uma tentativa importante para explorar as leis de escala do pré-treinamento
    • É um presente que contribui para a ciência
 
xguru 2025-02-28

O preço do GPT-4.5 (por 1M de tokens)

  • $75 por entrada
  • $37,50 por entrada em cache
  • $150 por saída
    Comparando com o 4o, a entrada é 30 vezes mais cara e a saída, 15 vezes.

Mas o desempenho não melhora nessa mesma proporção, então parece haver bastante insatisfação.

Ao usar o GPT-4.5 no Cursor, dizem que ele funciona de forma eficiente até em casos em que outros modelos falham.
Claro, é tão caro que é preciso pagar por uso. A reação foi algo como: "vou falir mandando ele fazer código complexo".
https://x.com/cursor_ai/status/1895210110714290302

 
bearmett 2025-02-28

Acho que tive um pensamento parecido ao ver o preço do Claude Code. Se você vive de salário, não é falência quando passa do seu valor por hora? 😵‍💫

 
botplaysdice 2025-02-28

Parece até que ainda bem, né. Dependendo do preço do modelo, o nosso valor também...;;;