- Novo modelo de raciocínio para resolver problemas complexos
- Treinado para pensar por mais tempo sobre o problema antes de responder
- Por meio do treinamento, aprendeu a aprimorar seu processo de pensamento, testar diferentes estratégias e reconhecer erros
- Apresenta desempenho semelhante ao de alunos de doutorado em benchmarks desafiadores de física, química e biologia
- Também obteve excelentes resultados em matemática e programação
- Na prova classificatória da Olimpíada Internacional de Matemática (IMO), enquanto o GPT-4o acertou apenas 13%, o modelo de raciocínio acertou 83%
- Em competições do Codeforces, alcançou o percentil 89 em habilidade de programação
Segurança
- Foi criada uma nova abordagem de treinamento em segurança para fazer o modelo seguir diretrizes de segurança e alinhamento
- Em um dos testes de jailbreak mais difíceis, o GPT-4o recebeu 22 pontos (de 100), enquanto o modelo o1-preview recebeu 84
- Foram reforçados os trabalhos de segurança, a governança interna e a cooperação com o governo federal
- Testes e avaliações rigorosos usando o Preparedness Framework
- Operação de red team no mais alto nível
- Processo de revisão em nível de conselho, incluindo o Safety & Security Committee
- Firmou acordo e iniciou operações com os institutos de segurança em IA dos Estados Unidos e do Reino Unido
Para quem é este modelo
- Pode ser especialmente útil para lidar com problemas complexos em áreas como ciência, programação e matemática
- Por exemplo
- Pesquisadores da área de saúde podem anotar dados de sequenciamento celular,
- Físicos podem gerar fórmulas matemáticas complexas necessárias para óptica quântica,
- Desenvolvedores podem usá-lo para criar e executar fluxos de trabalho em várias etapas
OpenAI o1-mini
- A série o1 se destaca em gerar e depurar código complexo com precisão
- Para oferecer uma solução mais eficiente aos desenvolvedores, também foi lançado um modelo de raciocínio mais rápido e barato chamado o1-mini
- O o1-mini é 80% mais barato que o o1-preview
- Um modelo poderoso e com bom custo-benefício para aplicações que precisam de raciocínio, mas não de amplo conhecimento geral
Como usar o OpenAI o1
- Usuários do ChatGPT Plus e Team podem acessar o modelo o1 no ChatGPT a partir de hoje
- Tanto o o1-preview quanto o o1-mini podem ser selecionados manualmente
- No lançamento, o o1-preview terá limite de 30 mensagens por semana, e o o1-mini, 50 por semana
- Usuários do ChatGPT Enterprise e Edu poderão acessar os dois modelos a partir da próxima semana
- Desenvolvedores no nível 5 de uso da API poderão começar a prototipar com os dois modelos na API a partir de hoje, com limite de taxa de 20 RPM
- A API desses modelos atualmente não inclui recursos como function calling, streaming e suporte a mensagens de sistema
- Há planos para oferecer acesso ao o1-mini a todos os usuários do ChatGPT Free
Planos futuros
- Esta é uma prévia inicial de modelos de raciocínio para o ChatGPT e a API
- Além de atualizar os modelos, há planos de adicionar recursos como navegação, envio de arquivos e upload de imagens para torná-los mais úteis para todos
- Há planos de continuar desenvolvendo e lançando modelos da série GPT junto com a nova série OpenAI o1
4 comentários
Estou curioso para ver a sinergia com o GitHub Copilot.
É esse o Strawberry dos rumores?
Isso mesmo. Altman consolou a pessoa que espalhou esse rumor.
Deve ser isso mesmo. Parece que eles escolheram o novo número de versão, 1, simplesmente para focar em raciocínio.