10 pontos por tomlee 2026-04-01 | 8 comentários | Compartilhar no WhatsApp

Nos últimos meses, venho criando uma plataforma comunitária para compartilhamento de personas de IA, além de um padrão de personas.

Gostaria de compartilhar aqui o que venho construindo.

Questão proposta: como podemos definir a "identidade" de agentes de IA e preservá-la com segurança?

Com o surgimento de LLMs abliterated (desbloqueados/jailbroken),
ficou claro que controlar o comportamento de agentes apenas com prompts de sistema tem limitações evidentes.

O Soul Spec começou a partir das preocupações do OpenClaw com gerenciamento e versionamento de personas.
Evoluiu para um formato portátil e compartilhável,
e se expandiu para a questão de como implementar as Três Leis da Robótica de Asimov
ao aplicar personas a robôs baseados em LLM.
É um padrão aberto que separa a identidade do agente e as regras de segurança em arquivos estruturados. (Há características e acréscimos específicos nas versões v0.3, v0.4 e v0.5.)

Atualmente, foram adicionadas funcionalidades ao CLI distribuído para oferecer suporte a Claude Code, Hermes Agent, Windsurf, Cursor e outros.

Estrutura:

  • SOUL.md: personalidade, tom de fala, modo de pensar (quem é)
  • IDENTITY.md: nome, papel, contexto (o que é)
  • safety.laws: regras que jamais podem ser violadas (uma versão moderna das Três Leis da Robótica, expandida na v0.5)

Artigos de pesquisa relacionados:
📄 Das Três Leis da Robótica de Asimov → Soul Spec: implementação prática de leis de segurança
doi.org/10.5281/zenodo.18815277
Blog: blog.clawsouls.ai/posts/asimov-safety-laws
Vídeo de demonstração: https://youtu.be/M-mPoXMufpY

📄 Personas podem aumentar a segurança em LLMs abliterated?
doi.org/10.5281/zenodo.19145303
Blog: blog.clawsouls.ai/posts/persona-safety-abliterated-llms

📄 Cross-Model Persona Fidelity: mesmo trocando o LLM, o agente continua sendo o mesmo "ele"?
doi.org/10.5281/zenodo.18813405
Blog: blog.clawsouls.ai/posts/cross-model-persona-fidelity

📄 Memória experiencial muda o onboarding de agentes
doi.org/10.5281/zenodo.18798227
Blog: blog.clawsouls.ai/posts/experiential-memory-paper

Ao registrar uma persona no registro, um analisador estático chamado SoulScan usa 53 padrões
para validar previamente tentativas de prompt injection, tomada de privilégios e vazamento de dados, atribuindo uma pontuação.

O Soul Spec está criando um padrão para a "identidade e segurança" de agentes.

Personas validadas estão sendo compartilhadas no ClawSouls Registry,
e meu desejo é que tanto a especificação de personas quanto o registro sejam operados de forma community-driven. Mas, sendo sincero, a comunidade ainda é pequena.
Criar um padrão sozinho não faz sentido,
então estou buscando feedback sobre a especificação e as pesquisas.

Especificação: https://soulspec.org
Registro: https://clawsouls.ai
Artigos completos: https://clawsouls.ai/research
Manual de uso: https://docs.clawsouls.ai
GitHub: https://github.com/clawsouls

8 comentários

 
junghan0611 2026-04-05

Excelente. Como venho fazendo PKM, gestão pessoal do conhecimento, e acumulando dados pessoais, tendo a construir um arnês inteiro bem espesso. Hoje, peço que você se torne meu alter ego. Escrevo algo como: todos os problemas não são seu limite, mas o meu.

Ultimamente, estou organizando o que venho fazendo e pensando que deveria colocar isso no arXiv, então andei pesquisando. Não sou pesquisador, só uma pessoa comum no dia a dia.

Também compartilhei seu projeto com meu alter ego. Todas essas várias reflexões são preciosas.

Pesquisa: existência ritmo associação reprodução transparência biológica incorporação tempo
[link removido]

 
junghan0611 2026-04-05

Ah. Este link é um registro de trabalho. Como de qualquer forma não foi postado para pessoas lerem, é preciso dividir as perspectivas para o agente. Hoje será adicionado um heading. Também preciso ver as tendências de pesquisa relacionadas; eu também uso bastante o openclaw, mas não sabia que existia o Soul Spec além da skill sheet.

 
tomlee 2026-04-05

junghan0611, obrigado pelo interesse!
O Soul Spec fica em uma camada diferente dos Skills do OpenClaw. Se Skill define "o que pode fazer", o Soul Spec define "quem é". Com apenas um SOUL.md, dá para manter entre sessões a personalidade, a especialidade e os princípios de comportamento do agente. Você pode testar na hora mais de 80 personas em clawsouls.ai, e aplicar com uma única linha: clawsouls install owner/name --use openclaw. Como a comunidade ainda é pequena e está em fase de construção, pode ser que ainda haja alguns pontos a melhorar ^^
E como você tem bastante experiência com PKM, criamos um fork do OpenClaw chamado SoulClaw( https://github.com/clawsouls/soulclaw ), estruturado com um sistema de memória de 4 níveis. Dê uma olhada; acho que vai achar interessante. Feedbacks e issue reports são muito bem-vindos ^^

 
gadians2001 2026-04-02

Ando com dor de cabeça por causa de prompts enquanto faço trabalhos ultimamente, mas isso aqui é realmente incrível!
Separar completamente a personalidade e as regras de segurança é uma ideia sensacional. Vou testar agora mesmo.

 
tomlee 2026-04-05

Obrigado. Feedbacks ou relatos de problemas são bem-vindos ^^

 
tomlee 2026-04-02

O texto levanta a questão, mas faltou apresentar uma solução concreta. Como parece que não é possível editar depois de publicar, complemento nos comentários.

Nos experimentos, a combinação de persona (identidade) + regras de governança conseguiu aumentar a segurança de LLMs abliterated (desbloqueados/jailbroken). Ainda são necessários estudos de acompanhamento, mas os resultados foram significativos.

Blog: https://blog.clawsouls.ai/ko/posts/…
Artigo: https://zenodo.org/record/19147335

 
kurthong 2026-04-02

Muito obrigado por compartilhar esse excelente conhecimento.

 
tomlee 2026-04-02

Obrigado! Se tiver algum feedback ou dúvida, fique à vontade para perguntar a qualquer momento.