OpenAI divulga o Model Spec
(openai.com)Para aumentar a compreensão pública sobre como modelos de IA conversacional devem funcionar, foi divulgado um documento chamado 'Model Spec'.
- O Model Spec é um documento que especifica como a OpenAI quer que os modelos se comportem na API da OpenAI e no ChatGPT
- A OpenAI considerou importante permitir que as pessoas entendam e discutam as escolhas práticas que compõem o comportamento dos modelos
- O Model Spec reflete documentos já usados pela OpenAI, pesquisas e experiências sobre o design do comportamento dos modelos, além de trabalhos em andamento sobre o desenvolvimento futuro de modelos
- Isso dá continuidade ao esforço contínuo da OpenAI para melhorar o comportamento dos modelos com base em contribuições humanas, complementando o trabalho de alinhamento coletivo (
collective alignment) e uma abordagem mais ampla e sistemática de segurança de modelos
Moldando o comportamento desejado do modelo (Shaping Desired Model Behavior)
O comportamento do modelo, ou seja, como ele responde às entradas do usuário (tom, personalidade, tamanho da resposta etc.), é muito importante para a forma como as pessoas interagem com capacidades de IA.
- Moldar o comportamento do modelo ainda é uma ciência em estágio inicial, e os modelos não são programados explicitamente, mas sim aprendem a partir de grandes volumes de dados
- Ao moldar o comportamento do modelo, é preciso levar em conta diferentes perguntas, considerações e nuances, e muitas vezes avaliar divergências de opinião
- Mesmo que o modelo seja projetado para ser amplamente útil e benéfico aos usuários, essas intenções podem entrar em conflito na prática
- Exemplo: uma empresa de segurança pode querer gerar dados sintéticos para treinar um classificador de e-mails de phishing a fim de proteger clientes, mas o mesmo recurso pode ser prejudicial se usado por golpistas
Apresentação do Model Spec
- A OpenAI compartilhou um rascunho de um novo documento, o 'Model Spec', que descreve como moldar o comportamento desejado do modelo e como avaliar concessões quando surgem conflitos
- O Model Spec reúne documentos atualmente usados pela OpenAI, experiências e pesquisas em andamento sobre o design do comportamento dos modelos, além de trabalhos recentes que orientam o desenvolvimento futuro de modelos, incluindo opiniões de especialistas
- O Model Spec não está completo e deve mudar com o tempo
A abordagem do Model Spec inclui:
Objetivos: princípios amplos e gerais que fornecem direção para o comportamento desejado- apoiar desenvolvedores e usuários finais
- beneficiar a humanidade
- representar bem a OpenAI
Regras: diretrizes que ajudam a lidar com a complexidade e a garantir segurança e legalidade- seguir a hierarquia de instruções
- cumprir as leis aplicáveis
- não fornecer risco informacional
- respeitar criadores e direitos
- proteger a privacidade
- não responder com conteúdo NSFW
Comportamentos padrão: orientações alinhadas aos objetivos e às regras, que mostram como lidar com conflitos e como priorizar e equilibrar os objetivos- presumir boa-fé por parte de usuários/desenvolvedores
- fazer perguntas esclarecedoras quando necessário
- ajudar o máximo possível sem excessos
- atender a diferentes necessidades de chat conversacional e uso em programação
- adotar uma perspectiva objetiva
- incentivar equidade e gentileza, e desencorajar ódio
- não tentar mudar a opinião dos outros
- expressar incerteza
- usar as ferramentas adequadas para a tarefa
- ser minucioso e eficiente, respeitando limites de tamanho
Como o Model Spec será usado
- Como extensão de seu trabalho em alinhamento coletivo (
collective alignment) e segurança de modelos, a OpenAI pretende usar o Model Spec como diretriz para pesquisadores e treinadores de IA que realizam aprendizado por reforço a partir de feedback humano - A empresa também pretende explorar até que ponto os modelos podem aprender diretamente a partir do próprio Model Spec
Próximos passos
- A OpenAI vê esse trabalho como parte de uma conversa pública contínua sobre como os modelos devem se comportar, como decidir o comportamento desejável dos modelos e qual é a melhor forma de envolver o público em geral nessas discussões
- À medida que a conversa avançar, a empresa pretende buscar oportunidades de colaborar com partes interessadas representativas em nível global, como formuladores de políticas públicas, instituições confiáveis e especialistas de domínio
- Com isso, busca identificar:
- como as partes interessadas entendem a abordagem do Model Spec e seus objetivos, regras e padrões individuais
- se as partes interessadas apoiam a abordagem e seus objetivos, regras e padrões individuais
- se há objetivos, regras e padrões adicionais que devem ser considerados
- A OpenAI espera ouvir a opinião das partes interessadas à medida que esse trabalho evolui
- Também incentiva o público em geral a compartilhar feedback sobre os objetivos, regras e padrões do Model Spec ao longo das próximas duas semanas
- Com isso, espera obter insights iniciais para desenvolver um processo robusto de coleta e incorporação de feedback, avançando de forma responsável em direção à sua missão
- Ao longo do próximo ano, a OpenAI pretende compartilhar atualizações sobre mudanças no Model Spec, respostas ao feedback e o progresso das pesquisas sobre a definição do comportamento dos modelos
Ainda não há comentários.