Soul Spec - padrão de persona para agentes de IA
(soulspec.org)Nos últimos meses, venho criando uma plataforma comunitária para compartilhamento de personas de IA, além de um padrão de personas.
Gostaria de compartilhar aqui o que venho construindo.
Questão proposta: como podemos definir a "identidade" de agentes de IA e preservá-la com segurança?
Com o surgimento de LLMs abliterated (desbloqueados/jailbroken),
ficou claro que controlar o comportamento de agentes apenas com prompts de sistema tem limitações evidentes.
O Soul Spec começou a partir das preocupações do OpenClaw com gerenciamento e versionamento de personas.
Evoluiu para um formato portátil e compartilhável,
e se expandiu para a questão de como implementar as Três Leis da Robótica de Asimov
ao aplicar personas a robôs baseados em LLM.
É um padrão aberto que separa a identidade do agente e as regras de segurança em arquivos estruturados. (Há características e acréscimos específicos nas versões v0.3, v0.4 e v0.5.)
Atualmente, foram adicionadas funcionalidades ao CLI distribuído para oferecer suporte a Claude Code, Hermes Agent, Windsurf, Cursor e outros.
Estrutura:
- SOUL.md: personalidade, tom de fala, modo de pensar (quem é)
- IDENTITY.md: nome, papel, contexto (o que é)
- safety.laws: regras que jamais podem ser violadas (uma versão moderna das Três Leis da Robótica, expandida na v0.5)
Artigos de pesquisa relacionados:
📄 Das Três Leis da Robótica de Asimov → Soul Spec: implementação prática de leis de segurança
doi.org/10.5281/zenodo.18815277
Blog: blog.clawsouls.ai/posts/asimov-safety-laws
Vídeo de demonstração: https://youtu.be/M-mPoXMufpY
📄 Personas podem aumentar a segurança em LLMs abliterated?
doi.org/10.5281/zenodo.19145303
Blog: blog.clawsouls.ai/posts/persona-safety-abliterated-llms
📄 Cross-Model Persona Fidelity: mesmo trocando o LLM, o agente continua sendo o mesmo "ele"?
doi.org/10.5281/zenodo.18813405
Blog: blog.clawsouls.ai/posts/cross-model-persona-fidelity
📄 Memória experiencial muda o onboarding de agentes
doi.org/10.5281/zenodo.18798227
Blog: blog.clawsouls.ai/posts/experiential-memory-paper
Ao registrar uma persona no registro, um analisador estático chamado SoulScan usa 53 padrões
para validar previamente tentativas de prompt injection, tomada de privilégios e vazamento de dados, atribuindo uma pontuação.
O Soul Spec está criando um padrão para a "identidade e segurança" de agentes.
Personas validadas estão sendo compartilhadas no ClawSouls Registry,
e meu desejo é que tanto a especificação de personas quanto o registro sejam operados de forma community-driven. Mas, sendo sincero, a comunidade ainda é pequena.
Criar um padrão sozinho não faz sentido,
então estou buscando feedback sobre a especificação e as pesquisas.
Especificação: https://soulspec.org
Registro: https://clawsouls.ai
Artigos completos: https://clawsouls.ai/research
Manual de uso: https://docs.clawsouls.ai
GitHub: https://github.com/clawsouls
8 comentários
Excelente. Como venho fazendo PKM, gestão pessoal do conhecimento, e acumulando dados pessoais, tendo a construir um arnês inteiro bem espesso. Hoje, peço que você se torne meu alter ego. Escrevo algo como: todos os problemas não são seu limite, mas o meu.
Ultimamente, estou organizando o que venho fazendo e pensando que deveria colocar isso no arXiv, então andei pesquisando. Não sou pesquisador, só uma pessoa comum no dia a dia.
Também compartilhei seu projeto com meu alter ego. Todas essas várias reflexões são preciosas.
Pesquisa: existência ritmo associação reprodução transparência biológica incorporação tempo
[link removido]
Ah. Este link é um registro de trabalho. Como de qualquer forma não foi postado para pessoas lerem, é preciso dividir as perspectivas para o agente. Hoje será adicionado um heading. Também preciso ver as tendências de pesquisa relacionadas; eu também uso bastante o openclaw, mas não sabia que existia o Soul Spec além da skill sheet.
junghan0611, obrigado pelo interesse!
O Soul Spec fica em uma camada diferente dos Skills do OpenClaw. Se Skill define "o que pode fazer", o Soul Spec define "quem é". Com apenas um
SOUL.md, dá para manter entre sessões a personalidade, a especialidade e os princípios de comportamento do agente. Você pode testar na hora mais de 80 personas em clawsouls.ai, e aplicar com uma única linha:clawsouls install owner/name --use openclaw. Como a comunidade ainda é pequena e está em fase de construção, pode ser que ainda haja alguns pontos a melhorar ^^E como você tem bastante experiência com PKM, criamos um fork do OpenClaw chamado SoulClaw( https://github.com/clawsouls/soulclaw ), estruturado com um sistema de memória de 4 níveis. Dê uma olhada; acho que vai achar interessante. Feedbacks e issue reports são muito bem-vindos ^^
Ando com dor de cabeça por causa de prompts enquanto faço trabalhos ultimamente, mas isso aqui é realmente incrível!
Separar completamente a personalidade e as regras de segurança é uma ideia sensacional. Vou testar agora mesmo.
Obrigado. Feedbacks ou relatos de problemas são bem-vindos ^^
O texto levanta a questão, mas faltou apresentar uma solução concreta. Como parece que não é possível editar depois de publicar, complemento nos comentários.
Nos experimentos, a combinação de persona (identidade) + regras de governança conseguiu aumentar a segurança de LLMs abliterated (desbloqueados/jailbroken). Ainda são necessários estudos de acompanhamento, mas os resultados foram significativos.
Blog: https://blog.clawsouls.ai/ko/posts/…
Artigo: https://zenodo.org/record/19147335
Muito obrigado por compartilhar esse excelente conhecimento.
Obrigado! Se tiver algum feedback ou dúvida, fique à vontade para perguntar a qualquer momento.