OpenAI divulga o Model Spec

(openai.com)

7 pontos por xguru 2024-05-10 | Ainda não há comentários. | Compartilhar no WhatsApp

Para aumentar a compreensão pública sobre como modelos de IA conversacional devem funcionar, foi divulgado um documento chamado 'Model Spec'.

O Model Spec é um documento que especifica como a OpenAI quer que os modelos se comportem na API da OpenAI e no ChatGPT
A OpenAI considerou importante permitir que as pessoas entendam e discutam as escolhas práticas que compõem o comportamento dos modelos
O Model Spec reflete documentos já usados pela OpenAI, pesquisas e experiências sobre o design do comportamento dos modelos, além de trabalhos em andamento sobre o desenvolvimento futuro de modelos
Isso dá continuidade ao esforço contínuo da OpenAI para melhorar o comportamento dos modelos com base em contribuições humanas, complementando o trabalho de alinhamento coletivo (collective alignment) e uma abordagem mais ampla e sistemática de segurança de modelos

Moldando o comportamento desejado do modelo (Shaping Desired Model Behavior)

O comportamento do modelo, ou seja, como ele responde às entradas do usuário (tom, personalidade, tamanho da resposta etc.), é muito importante para a forma como as pessoas interagem com capacidades de IA.

Moldar o comportamento do modelo ainda é uma ciência em estágio inicial, e os modelos não são programados explicitamente, mas sim aprendem a partir de grandes volumes de dados
Ao moldar o comportamento do modelo, é preciso levar em conta diferentes perguntas, considerações e nuances, e muitas vezes avaliar divergências de opinião
Mesmo que o modelo seja projetado para ser amplamente útil e benéfico aos usuários, essas intenções podem entrar em conflito na prática
- Exemplo: uma empresa de segurança pode querer gerar dados sintéticos para treinar um classificador de e-mails de phishing a fim de proteger clientes, mas o mesmo recurso pode ser prejudicial se usado por golpistas

Apresentação do Model Spec

A OpenAI compartilhou um rascunho de um novo documento, o 'Model Spec', que descreve como moldar o comportamento desejado do modelo e como avaliar concessões quando surgem conflitos
O Model Spec reúne documentos atualmente usados pela OpenAI, experiências e pesquisas em andamento sobre o design do comportamento dos modelos, além de trabalhos recentes que orientam o desenvolvimento futuro de modelos, incluindo opiniões de especialistas
O Model Spec não está completo e deve mudar com o tempo

A abordagem do Model Spec inclui:

Objetivos: princípios amplos e gerais que fornecem direção para o comportamento desejado
- apoiar desenvolvedores e usuários finais
- beneficiar a humanidade
- representar bem a OpenAI
Regras: diretrizes que ajudam a lidar com a complexidade e a garantir segurança e legalidade
- seguir a hierarquia de instruções
- cumprir as leis aplicáveis
- não fornecer risco informacional
- respeitar criadores e direitos
- proteger a privacidade
- não responder com conteúdo NSFW
Comportamentos padrão: orientações alinhadas aos objetivos e às regras, que mostram como lidar com conflitos e como priorizar e equilibrar os objetivos
- presumir boa-fé por parte de usuários/desenvolvedores
- fazer perguntas esclarecedoras quando necessário
- ajudar o máximo possível sem excessos
- atender a diferentes necessidades de chat conversacional e uso em programação
- adotar uma perspectiva objetiva
- incentivar equidade e gentileza, e desencorajar ódio
- não tentar mudar a opinião dos outros
- expressar incerteza
- usar as ferramentas adequadas para a tarefa
- ser minucioso e eficiente, respeitando limites de tamanho

Como o Model Spec será usado

Como extensão de seu trabalho em alinhamento coletivo (collective alignment) e segurança de modelos, a OpenAI pretende usar o Model Spec como diretriz para pesquisadores e treinadores de IA que realizam aprendizado por reforço a partir de feedback humano
A empresa também pretende explorar até que ponto os modelos podem aprender diretamente a partir do próprio Model Spec

Próximos passos

A OpenAI vê esse trabalho como parte de uma conversa pública contínua sobre como os modelos devem se comportar, como decidir o comportamento desejável dos modelos e qual é a melhor forma de envolver o público em geral nessas discussões
À medida que a conversa avançar, a empresa pretende buscar oportunidades de colaborar com partes interessadas representativas em nível global, como formuladores de políticas públicas, instituições confiáveis e especialistas de domínio
Com isso, busca identificar:
1. como as partes interessadas entendem a abordagem do Model Spec e seus objetivos, regras e padrões individuais
2. se as partes interessadas apoiam a abordagem e seus objetivos, regras e padrões individuais
3. se há objetivos, regras e padrões adicionais que devem ser considerados
A OpenAI espera ouvir a opinião das partes interessadas à medida que esse trabalho evolui
Também incentiva o público em geral a compartilhar feedback sobre os objetivos, regras e padrões do Model Spec ao longo das próximas duas semanas
Com isso, espera obter insights iniciais para desenvolver um processo robusto de coleta e incorporação de feedback, avançando de forma responsável em direção à sua missão
Ao longo do próximo ano, a OpenAI pretende compartilhar atualizações sobre mudanças no Model Spec, respostas ao feedback e o progresso das pesquisas sobre a definição do comportamento dos modelos