- Hoje a OpenAI lançou o GPT-4.5
- O motivo de ter esperado cerca de 2 anos desde o lançamento do GPT-4 é que este release oferece a oportunidade de medir quantitativamente os ganhos que se obtém ao treinar um modelo simplesmente maior
- O ".5" de cada versão significa aproximadamente 10 vezes mais computação de pré-treinamento
- Processo de evolução dos modelos GPT
- GPT-1 → quase não conseguia gerar frases com sentido
- GPT-2 → nível de brinquedo desajeitado
- GPT-2.5 → na prática foi pulado e a transição foi direto para o GPT-3
- GPT-3 → mostrou avanços interessantes
- GPT-3.5 → evoluiu a ponto de ser lançado como produto real e desencadeou o boom do ChatGPT
- GPT-4 → melhorou mais, mas era difícil encontrar um ponto claro de "uau"
- Em especial, comparando GPT-4 vs GPT-3.5:
- a escolha de palavras é mais criativa e entende melhor as nuances do prompt
- analogias são um pouco mais adequadas e o senso de humor melhora um pouco
- a compreensão melhora até em áreas de conhecimento raras, e a frequência de alucinações cai um pouco
- no geral, parecia que tudo tinha melhorado 20%
- foi uma melhora como a água subindo e fazendo todos os barcos flutuarem
Impressões dos testes com o GPT-4.5
- O GPT-4.5 passou por 10 vezes mais pré-treinamento do que o GPT-4
- E, depois de testar, o mesmo padrão daqueles 20% se repetiu
- Tudo ficou um pouco melhor
- mas não há um ponto de inovação claramente identificável
- ainda assim, isso se torna um indicador interessante e importante para medir a inclinação da direção geral de melhoria dos modelos
O GPT-4.5 ainda não é um modelo de "raciocínio"
- Ao GPT-4.5 foram aplicados apenas pré-treinamento, ajuste supervisionado (SFT) e RLHF
- Portanto, ele não melhora em problemas que exigem raciocínio lógico, como matemática e programação
- Nessas áreas, são necessários aprendizado por reforço (RL) e treinamento de pensamento sistemático, e no momento o modelo OpenAI o1 apresenta o melhor desempenho
- Provavelmente a OpenAI tem grande chance de, com base no GPT-4.5, aplicar aprendizado por reforço para evoluí-lo para um modelo que "pensa"
- Com isso, tentará melhorar as capacidades em matemática, lógica e programação
Ponto forte do GPT-4.5: EQ
- Houve melhora em tarefas em que, mais do que raciocínio lógico, conhecimento de mundo, criatividade, analogia, senso de humor e inteligência emocional (EQ) são importantes
Então ele pretende fazer um experimento interativo: "votação comparando GPT-4 vs GPT-4.5"
Ainda não há comentários.