OpenAI revela prévia do modelo o1, que pensa mais antes de responder

xguru · 2024-09-13T08:50:46+09:00

Novo modelo de raciocínio para resolver problemas complexos Treinado para pensar por mais tempo sobre o problema antes de responder Por meio do treinamento, aprendeu a aprimorar seu processo de pensamento, testar diferentes estratégias e reconhecer erros Apresenta desempenho semelhante ao de alunos de doutorado em benchmarks desafiadores de física, química e biologia Também obteve excelentes resultados em matemática e programação Na prova classificatória da Olimpíada Internacional de Matemática (IMO), enquanto o GPT-4o acertou apenas 13%, o modelo de raciocínio acertou 83% Em competições do Codeforces, alcançou o percentil 89 em habilidade de programação Segurança Foi criada uma nova abordagem de treinamento em segurança para fazer o modelo seguir diretrizes de segurança e alinhamento Em um dos testes de jailbreak mais difíceis, o GPT-4o recebeu 22 pontos (de 100), enquanto o modelo o1-preview recebeu 84 Foram reforçados os trabalhos de segurança, a governança interna e a cooperação com o governo federal Testes e avaliações rigorosos usando o Preparedness Framework Operação de red team no mais alto nível Processo de revisão em nível de conselho, incluindo o Safety & Security Committee Firmou acordo e iniciou operações com os institutos de segurança em IA dos Estados Unidos e do Reino Unido Para quem é este modelo Pode ser especialmente útil para lidar com problemas complexos em áreas como ciência, programação e matemática Por exemplo Pesquisadores da área de saúde podem anotar dados de sequenciamento celular, Físicos podem gerar fórmulas matemáticas complexas necessárias para óptica quântica, Desenvolvedores podem usá-lo para criar e executar fluxos de trabalho em várias etapas OpenAI o1-mini A série o1 se destaca em gerar e depurar código complexo com precisão Para oferecer uma solução mais eficiente aos desenvolvedores, também foi lançado um modelo de raciocínio mais rápido e barato chamado o1-mini O o1-mini é 80% mais barato que o o1-preview Um modelo poderoso e com bom custo-benefício para aplicações que precisam de raciocínio, mas não de amplo conhecimento geral Como usar o OpenAI o1 Usuários do ChatGPT Plus e Team podem acessar o modelo o1 no ChatGPT a partir de hoje Tanto o o1-preview quanto o o1-mini podem ser selecionados manualmente No lançamento, o o1-preview terá limite de 30 mensagens por semana, e o o1-mini, 50 por semana Usuários do ChatGPT Enterprise e Edu poderão acessar os dois modelos a partir da próxima semana Desenvolvedores no nível 5 de uso da API poderão começar a prototipar com os dois modelos na API a partir de hoje, com limite de taxa de 20 RPM A API desses modelos atualmente não inclui recursos como function calling, streaming e suporte a mensagens de sistema Há planos para oferecer acesso ao o1-mini a todos os usuários do ChatGPT Free Planos futuros Esta é uma prévia inicial de modelos de raciocínio para o ChatGPT e a API Além de atualizar os modelos, há planos de adicionar recursos como navegação, envio de arquivos e upload de imagens para torná-los mais úteis para todos Há planos de continuar desenvolvendo e lançando modelos da série GPT junto com a nova série OpenAI o1

(openai.com)

8 pontos por xguru 2024-09-13 | 4 comentários | Compartilhar no WhatsApp

Novo modelo de raciocínio para resolver problemas complexos
Treinado para pensar por mais tempo sobre o problema antes de responder
Por meio do treinamento, aprendeu a aprimorar seu processo de pensamento, testar diferentes estratégias e reconhecer erros
Apresenta desempenho semelhante ao de alunos de doutorado em benchmarks desafiadores de física, química e biologia
Também obteve excelentes resultados em matemática e programação
- Na prova classificatória da Olimpíada Internacional de Matemática (IMO), enquanto o GPT-4o acertou apenas 13%, o modelo de raciocínio acertou 83%
- Em competições do Codeforces, alcançou o percentil 89 em habilidade de programação

Segurança

Foi criada uma nova abordagem de treinamento em segurança para fazer o modelo seguir diretrizes de segurança e alinhamento
Em um dos testes de jailbreak mais difíceis, o GPT-4o recebeu 22 pontos (de 100), enquanto o modelo o1-preview recebeu 84
Foram reforçados os trabalhos de segurança, a governança interna e a cooperação com o governo federal
- Testes e avaliações rigorosos usando o Preparedness Framework
- Operação de red team no mais alto nível
- Processo de revisão em nível de conselho, incluindo o Safety & Security Committee
Firmou acordo e iniciou operações com os institutos de segurança em IA dos Estados Unidos e do Reino Unido

Para quem é este modelo

Pode ser especialmente útil para lidar com problemas complexos em áreas como ciência, programação e matemática
Por exemplo
- Pesquisadores da área de saúde podem anotar dados de sequenciamento celular,
- Físicos podem gerar fórmulas matemáticas complexas necessárias para óptica quântica,
- Desenvolvedores podem usá-lo para criar e executar fluxos de trabalho em várias etapas

OpenAI o1-mini

A série o1 se destaca em gerar e depurar código complexo com precisão
Para oferecer uma solução mais eficiente aos desenvolvedores, também foi lançado um modelo de raciocínio mais rápido e barato chamado o1-mini
O o1-mini é 80% mais barato que o o1-preview
- Um modelo poderoso e com bom custo-benefício para aplicações que precisam de raciocínio, mas não de amplo conhecimento geral

Como usar o OpenAI o1

Usuários do ChatGPT Plus e Team podem acessar o modelo o1 no ChatGPT a partir de hoje
Tanto o o1-preview quanto o o1-mini podem ser selecionados manualmente
No lançamento, o o1-preview terá limite de 30 mensagens por semana, e o o1-mini, 50 por semana
Usuários do ChatGPT Enterprise e Edu poderão acessar os dois modelos a partir da próxima semana
Desenvolvedores no nível 5 de uso da API poderão começar a prototipar com os dois modelos na API a partir de hoje, com limite de taxa de 20 RPM
A API desses modelos atualmente não inclui recursos como function calling, streaming e suporte a mensagens de sistema
Há planos para oferecer acesso ao o1-mini a todos os usuários do ChatGPT Free

Planos futuros

Esta é uma prévia inicial de modelos de raciocínio para o ChatGPT e a API
Além de atualizar os modelos, há planos de adicionar recursos como navegação, envio de arquivos e upload de imagens para torná-los mais úteis para todos
Há planos de continuar desenvolvendo e lançando modelos da série GPT junto com a nova série OpenAI o1

4 comentários

dbs0829 2024-09-13

Estou curioso para ver a sinergia com o GitHub Copilot.

wedding 2024-09-13

É esse o Strawberry dos rumores?

brainer 2024-09-13

Isso mesmo. Altman consolou a pessoa que espalhou esse rumor.

xguru 2024-09-13

Deve ser isso mesmo. Parece que eles escolheram o novo número de versão, 1, simplesmente para focar em raciocínio.