8 pontos por xguru 2024-09-13 | 4 comentários | Compartilhar no WhatsApp
  • Novo modelo de raciocínio para resolver problemas complexos
  • Treinado para pensar por mais tempo sobre o problema antes de responder
  • Por meio do treinamento, aprendeu a aprimorar seu processo de pensamento, testar diferentes estratégias e reconhecer erros
  • Apresenta desempenho semelhante ao de alunos de doutorado em benchmarks desafiadores de física, química e biologia
  • Também obteve excelentes resultados em matemática e programação
    • Na prova classificatória da Olimpíada Internacional de Matemática (IMO), enquanto o GPT-4o acertou apenas 13%, o modelo de raciocínio acertou 83%
    • Em competições do Codeforces, alcançou o percentil 89 em habilidade de programação

Segurança

  • Foi criada uma nova abordagem de treinamento em segurança para fazer o modelo seguir diretrizes de segurança e alinhamento
  • Em um dos testes de jailbreak mais difíceis, o GPT-4o recebeu 22 pontos (de 100), enquanto o modelo o1-preview recebeu 84
  • Foram reforçados os trabalhos de segurança, a governança interna e a cooperação com o governo federal
    • Testes e avaliações rigorosos usando o Preparedness Framework
    • Operação de red team no mais alto nível
    • Processo de revisão em nível de conselho, incluindo o Safety & Security Committee
  • Firmou acordo e iniciou operações com os institutos de segurança em IA dos Estados Unidos e do Reino Unido

Para quem é este modelo

  • Pode ser especialmente útil para lidar com problemas complexos em áreas como ciência, programação e matemática
  • Por exemplo
    • Pesquisadores da área de saúde podem anotar dados de sequenciamento celular,
    • Físicos podem gerar fórmulas matemáticas complexas necessárias para óptica quântica,
    • Desenvolvedores podem usá-lo para criar e executar fluxos de trabalho em várias etapas

OpenAI o1-mini

  • A série o1 se destaca em gerar e depurar código complexo com precisão
  • Para oferecer uma solução mais eficiente aos desenvolvedores, também foi lançado um modelo de raciocínio mais rápido e barato chamado o1-mini
  • O o1-mini é 80% mais barato que o o1-preview
    • Um modelo poderoso e com bom custo-benefício para aplicações que precisam de raciocínio, mas não de amplo conhecimento geral

Como usar o OpenAI o1

  • Usuários do ChatGPT Plus e Team podem acessar o modelo o1 no ChatGPT a partir de hoje
  • Tanto o o1-preview quanto o o1-mini podem ser selecionados manualmente
  • No lançamento, o o1-preview terá limite de 30 mensagens por semana, e o o1-mini, 50 por semana
  • Usuários do ChatGPT Enterprise e Edu poderão acessar os dois modelos a partir da próxima semana
  • Desenvolvedores no nível 5 de uso da API poderão começar a prototipar com os dois modelos na API a partir de hoje, com limite de taxa de 20 RPM
  • A API desses modelos atualmente não inclui recursos como function calling, streaming e suporte a mensagens de sistema
  • Há planos para oferecer acesso ao o1-mini a todos os usuários do ChatGPT Free

Planos futuros

  • Esta é uma prévia inicial de modelos de raciocínio para o ChatGPT e a API
  • Além de atualizar os modelos, há planos de adicionar recursos como navegação, envio de arquivos e upload de imagens para torná-los mais úteis para todos
  • Há planos de continuar desenvolvendo e lançando modelos da série GPT junto com a nova série OpenAI o1

4 comentários

 
dbs0829 2024-09-13

Estou curioso para ver a sinergia com o GitHub Copilot.

 
wedding 2024-09-13

É esse o Strawberry dos rumores?

 
brainer 2024-09-13

Isso mesmo. Altman consolou a pessoa que espalhou esse rumor.

 
xguru 2024-09-13

Deve ser isso mesmo. Parece que eles escolheram o novo número de versão, 1, simplesmente para focar em raciocínio.