Como montar uma equipe de agentes de IA que faz reviews como coreanos de verdade (fork do Harness + 1 milhão de personas da NVIDIA)
(github.com/hongsw)TL;DR
Em harnesses focados em review — revisão de código, revisão de documentação, pesquisa de UX, simulação de entrevistas — há valor quando 5 reviewers trazem 5 perspectivas diferentes. Em equipes comuns de agentes de IA, os 5 acabam tendo praticamente o mesmo
tom e ponto de vista, então na prática é a opinião de 1 pessoa repetida 5 vezes.
Este fork puxa o NVIDIA Nemotron-Personas-Korea (1 milhão de linhas, CC BY 4.0) com busca dinâmica em tempo de execução, aplicando aos agentes personas reais do ambiente de trabalho coreano (até cargo, geração, região e situação familiar) para gerar reviews com perspectivas genuinamente diferentes.
Por que profundidade de persona é necessária em um harness de review
Mesmo olhando o mesmo código/documento/design, cada pessoa enxerga de um jeito:
-
Líder de backend de 45 anos com experiência em SI
→ "Do ponto de vista de gestão de risco, vamos por um rollout em etapas. Se validarmos bem antes, isso acaba encurtando o cronograma." -
Growth marketer de 24 anos da geração MZ
→ "A postura de levantar rápido hipóteses para a causa quando o número dispara é boa, mas o nível de significância está meio fraco. Vamos rodar mais testes A/B?" -
PM de 38 anos, mãe que trabalha
→ "Em resumo, se isso não entra ainda neste trimestre, peço que a gente revise as prioridades primeiro." -
Designer de 27 anos com experiência em fintech
→ "Nos dados qualitativos das entrevistas com usuários, o comentário de que 'o momento de receber o cupom é meio sem graça' apareceu repetidamente."
→ Mesmo olhando o mesmo código, 4 pessoas identificam riscos/valores/prioridades diferentes. Essa é a essência de uma equipe de review.
O que foi adicionado (3 novas skills, sem invasão)
Sem mexer no revfactory/harness existente, há desvio de trigger automático por palavras-chave na description:
korean-persona-search— filtro multieixo com Parquet predicate pushdown (cargo, região, idade, escolaridade, geração) + amostragem com diversidadekorean-voice-adapter— matriz de estilo formal/polido + cultura de trabalho coreana (linha de reporte, etiqueta em reuniões, expressões indiretas) + dicionário de vocabulário de 13 setoreskorean-persona-harness— meta-orquestrador (pipeline com 5 subagentes: analista de cenário → curador de personas → adaptador de fala → construtor de agentes → QA de diversidade)
Compatível tanto com Claude Code quanto com Codex CLI — mesmo formato de SKILL.md, com cache de dataset compartilhado.
Validação — mesmo LLM, mesma tarefa, mesmo volume (102 linhas vs 103 linhas)
Simulação da ata de uma reunião semanal de stand-up de uma equipe de 5 pessoas. A precisão de domínio é equivalente. A diferença aparece na diversidade de perspectivas.
Resultado do harness comum:
- Identificabilidade da voz: baixa (os 5 falam quase no mesmo tom)
- Etiqueta do ambiente de trabalho coreano: mínima
- Respostas mútuas, incentivo e agradecimento: 0 vezes
- Tom de pedido/confirmação: 5 vezes
- Exposição de situação pessoal: 0 casos
Resultado do korean-persona-harness:
- Identificabilidade da voz: muito alta (dá para identificar mesmo sem os nomes)
- Etiqueta do ambiente de trabalho coreano: rica (evitar afirmações categóricas, mentoria, tom de confirmação)
- Respostas mútuas, incentivo e agradecimento: 4 vezes
- Tom de pedido/confirmação: 11 vezes
- Exposição de situação pessoal: 2 casos (agenda familiar, apelo à autoridade)
Detalhe humano que apareceu só no Run B:
Backend (pai de dois filhos): "Na semana que vem eu vou ter uns compromissos com as crianças, então talvez fosse bom deixar uma rotação já organizada com antecedência."
- Etiqueta do ambiente de trabalho coreano: mínima
- Etiqueta do ambiente de trabalho coreano: mínima
- Respostas mútuas, incentivo e agradecimento: 0 vezes
- Tom de pedido/confirmação: 5 vezes
- Exposição de situação pessoal: 0 casos
Resultado do korean-persona-harness:
- Identificabilidade da voz: muito alta (dá para identificar mesmo sem os nomes)
- Etiqueta do ambiente de trabalho coreano: rica (evitar afirmações categóricas, mentoria, tom de confirmação)
- Respostas mútuas, incentivo e agradecimento: 4 vezes
- Tom de pedido/confirmação: 11 vezes
- Exposição de situação pessoal: 2 casos (agenda familiar, apelo à autoridade)
Detalhe humano que apareceu só no Run B:
Backend (pai de dois filhos): "Na semana que vem eu vou ter uns compromissos com as crianças, então talvez fosse bom deixar uma rotação já organizada com antecedência."
Líder (45 anos) → Marketer (24 anos): "A postura de levantar rápido hipóteses para a causa quando o número dispara, continue exatamente assim."
Marketer: "Ah, obrigado, líder!"
Líder: "Mas há indícios de que nossa política de retry está agressiva demais e acabou amplificando parte da falha. Vou evitar cravar isso até a versão final do RCA."
→ Personas de família, geração e função se combinam naturalmente na fala. Não é um abstrato "priorizar estabilidade", mas sim o porquê de essa pessoa ter essa prioridade aparecendo no comportamento.
Matriz de valor — onde isso é mais útil
- Code review (5 pessoas com perspectivas diferentes) → muito alto
- Simulação de entrevistas com usuários virtuais → muito alto
- Review de copy de marketing para usuários coreanos → muito alto
- Pesquisa de UX e workshop de personas → alto
- Simulação de atas e colaboração em reuniões → alto
- RFC e documentação técnica → médio
- Infra e arquitetura → baixo (o
harnesspadrão é mais adequado)
Instalação (1 linha)
Claude Code:
/plugin marketplace add hongsw/harness
/plugin install harness@harness
Codex CLI:
python3 ~/.codex/skills/.system/skill-installer/scripts/install-skill-from-github.py \
--repo hongsw/harness \
--path skills/korean-persona-search \
--path skills/korean-voice-adapter \
--path skills/korean-persona-harness
Cache do dataset (compartilhado entre os dois runtimes):
pip install huggingface_hub pyarrow
python3 $SKILL_DIR/korean-persona-search/scripts/download.py
⚠️ Atenção: o instalador existente do revfactory/harness usa o mesmo nome de marketplace e plugin, então é necessária uma migração em 4 etapas:
/plugin uninstall harness@harness
/plugin marketplace remove harness-marketplace
/plugin marketplace add hongsw/harness
/plugin install harness@harness
Links
- Repositório do fork: github.com/hongsw/harness
- PR #9 no upstream (aguardando merge): github.com/revfactory/harness/pull/9
- Artefatos de validação: _workspace/comparison_test
- Dataset: huggingface.co/.../Nemotron-Personas-Korea (CC BY 4.0)
- Harness original: github.com/revfactory/harness
1 comentários
Interessante, haha. Nós também estamos seguindo por um caminho diferente em uma área parecida — é o ClawSouls (clawsouls.ai), uma plataforma de registro e compartilhamento para armazenar personas. As personas registradas uma vez podem ser aplicadas a plataformas de agentes como OpenClaw, Claude Code, Cursor e Hermes Agent por meio do pacote npm
clawsouls. Agradeceríamos se pudesse publicar também. Essa plataforma já foi apresentada no GeekNews. Show GN: ClawSouls – registro aberto para trocar a persona de agentes de IA com uma linha Se tiver interesse em colaborar, por favor entre em contato conosco ^^ ( contact@clawsouls.ai )