- Texto publicado no blog por Jan Leike, líder da equipe de alignment da OpenAI, traduzido com DeepL
- Alignment é "alinhar um sistema de IA a um ser humano"
- Há duas categorias de alinhamento: com as "preferências individuais (todo mundo quer uma IA alinhada a si mesmo)" e com as "preferências coletivas (para quais usos a IA pode ser utilizada e qual deve ser seu funcionamento padrão?)"
- Este texto trata da segunda categoria
Proposta: democracia deliberativa simulada
- A ideia central é usar grandes modelos de linguagem para aprender a imitar a "democracia deliberativa"
- Democracia deliberativa é um processo de tomada de decisão ou formulação de políticas em que um pequeno grupo do público escolhido aleatoriamente ("mini-público") delibera explicitamente
- Como construir uma democracia deliberativa simulada
- Coleta de um conjunto de dados de perguntas sobre valores
- Registros de deliberação humana
- Aprendizado por imitação condicionado ao contexto
- Simulação: perguntas sobre novos valores
1 comentários
Recomendo ler junto o texto do Seungjun Choi, "Explicação complementar sobre o contexto deste artigo". (Há também um link no início do documento)
https://facebook.com/seungjoon.choi/posts/…