Como montar uma equipe de agentes de IA que faz reviews como coreanos de verdade (fork do Harness + 1 milhão de personas da NVIDIA)

(github.com/hongsw)

6 pontos por fastkoder 2026-04-28 | 1 comentários | Compartilhar no WhatsApp

TL;DR

Em harnesses focados em review — revisão de código, revisão de documentação, pesquisa de UX, simulação de entrevistas — há valor quando 5 reviewers trazem 5 perspectivas diferentes. Em equipes comuns de agentes de IA, os 5 acabam tendo praticamente o mesmo
tom e ponto de vista, então na prática é a opinião de 1 pessoa repetida 5 vezes.

Este fork puxa o NVIDIA Nemotron-Personas-Korea (1 milhão de linhas, CC BY 4.0) com busca dinâmica em tempo de execução, aplicando aos agentes personas reais do ambiente de trabalho coreano (até cargo, geração, região e situação familiar) para gerar reviews com perspectivas genuinamente diferentes.

Por que profundidade de persona é necessária em um harness de review

Mesmo olhando o mesmo código/documento/design, cada pessoa enxerga de um jeito:

Líder de backend de 45 anos com experiência em SI
→ "Do ponto de vista de gestão de risco, vamos por um rollout em etapas. Se validarmos bem antes, isso acaba encurtando o cronograma."
Growth marketer de 24 anos da geração MZ
→ "A postura de levantar rápido hipóteses para a causa quando o número dispara é boa, mas o nível de significância está meio fraco. Vamos rodar mais testes A/B?"
PM de 38 anos, mãe que trabalha
→ "Em resumo, se isso não entra ainda neste trimestre, peço que a gente revise as prioridades primeiro."
Designer de 27 anos com experiência em fintech
→ "Nos dados qualitativos das entrevistas com usuários, o comentário de que 'o momento de receber o cupom é meio sem graça' apareceu repetidamente."

→ Mesmo olhando o mesmo código, 4 pessoas identificam riscos/valores/prioridades diferentes. Essa é a essência de uma equipe de review.

O que foi adicionado (3 novas skills, sem invasão)

Sem mexer no revfactory/harness existente, há desvio de trigger automático por palavras-chave na description:

korean-persona-search — filtro multieixo com Parquet predicate pushdown (cargo, região, idade, escolaridade, geração) + amostragem com diversidade
korean-voice-adapter — matriz de estilo formal/polido + cultura de trabalho coreana (linha de reporte, etiqueta em reuniões, expressões indiretas) + dicionário de vocabulário de 13 setores
korean-persona-harness — meta-orquestrador (pipeline com 5 subagentes: analista de cenário → curador de personas → adaptador de fala → construtor de agentes → QA de diversidade)

Compatível tanto com Claude Code quanto com Codex CLI — mesmo formato de SKILL.md, com cache de dataset compartilhado.

Validação — mesmo LLM, mesma tarefa, mesmo volume (102 linhas vs 103 linhas)

Simulação da ata de uma reunião semanal de stand-up de uma equipe de 5 pessoas. A precisão de domínio é equivalente. A diferença aparece na diversidade de perspectivas.

Resultado do harness comum:

Identificabilidade da voz: baixa (os 5 falam quase no mesmo tom)
Etiqueta do ambiente de trabalho coreano: mínima
Respostas mútuas, incentivo e agradecimento: 0 vezes
Tom de pedido/confirmação: 5 vezes
Exposição de situação pessoal: 0 casos

Resultado do korean-persona-harness:

Identificabilidade da voz: muito alta (dá para identificar mesmo sem os nomes)
Etiqueta do ambiente de trabalho coreano: rica (evitar afirmações categóricas, mentoria, tom de confirmação)
Respostas mútuas, incentivo e agradecimento: 4 vezes
Tom de pedido/confirmação: 11 vezes
Exposição de situação pessoal: 2 casos (agenda familiar, apelo à autoridade)

Detalhe humano que apareceu só no Run B:

Backend (pai de dois filhos): "Na semana que vem eu vou ter uns compromissos com as crianças, então talvez fosse bom deixar uma rotação já organizada com antecedência."

Etiqueta do ambiente de trabalho coreano: mínima
Etiqueta do ambiente de trabalho coreano: mínima
Respostas mútuas, incentivo e agradecimento: 0 vezes
Tom de pedido/confirmação: 5 vezes
Exposição de situação pessoal: 0 casos

Resultado do korean-persona-harness:

Identificabilidade da voz: muito alta (dá para identificar mesmo sem os nomes)
Etiqueta do ambiente de trabalho coreano: rica (evitar afirmações categóricas, mentoria, tom de confirmação)
Respostas mútuas, incentivo e agradecimento: 4 vezes
Tom de pedido/confirmação: 11 vezes
Exposição de situação pessoal: 2 casos (agenda familiar, apelo à autoridade)

Detalhe humano que apareceu só no Run B:

Backend (pai de dois filhos): "Na semana que vem eu vou ter uns compromissos com as crianças, então talvez fosse bom deixar uma rotação já organizada com antecedência."

Líder (45 anos) → Marketer (24 anos): "A postura de levantar rápido hipóteses para a causa quando o número dispara, continue exatamente assim."
Marketer: "Ah, obrigado, líder!"

Líder: "Mas há indícios de que nossa política de retry está agressiva demais e acabou amplificando parte da falha. Vou evitar cravar isso até a versão final do RCA."

→ Personas de família, geração e função se combinam naturalmente na fala. Não é um abstrato "priorizar estabilidade", mas sim o porquê de essa pessoa ter essa prioridade aparecendo no comportamento.

Matriz de valor — onde isso é mais útil

Code review (5 pessoas com perspectivas diferentes) → muito alto
Simulação de entrevistas com usuários virtuais → muito alto
Review de copy de marketing para usuários coreanos → muito alto
Pesquisa de UX e workshop de personas → alto
Simulação de atas e colaboração em reuniões → alto
RFC e documentação técnica → médio
Infra e arquitetura → baixo (o harness padrão é mais adequado)

Instalação (1 linha)

Claude Code:

  /plugin marketplace add hongsw/harness  
  /plugin install harness@harness

Codex CLI:

  python3 ~/.codex/skills/.system/skill-installer/scripts/install-skill-from-github.py \  
      --repo hongsw/harness \  
      --path skills/korean-persona-search \  
      --path skills/korean-voice-adapter \  
      --path skills/korean-persona-harness

Cache do dataset (compartilhado entre os dois runtimes):

  pip install huggingface_hub pyarrow  
  python3 $SKILL_DIR/korean-persona-search/scripts/download.py

⚠️ Atenção: o instalador existente do revfactory/harness usa o mesmo nome de marketplace e plugin, então é necessária uma migração em 4 etapas:

  /plugin uninstall harness@harness  
  /plugin marketplace remove harness-marketplace  
  /plugin marketplace add hongsw/harness  
  /plugin install harness@harness

1 comentários

tomlee 2026-04-28

Interessante, haha. Nós também estamos seguindo por um caminho diferente em uma área parecida — é o ClawSouls (clawsouls.ai), uma plataforma de registro e compartilhamento para armazenar personas. As personas registradas uma vez podem ser aplicadas a plataformas de agentes como OpenClaw, Claude Code, Cursor e Hermes Agent por meio do pacote npm clawsouls. Agradeceríamos se pudesse publicar também. Essa plataforma já foi apresentada no GeekNews. Show GN: ClawSouls – registro aberto para trocar a persona de agentes de IA com uma linha Se tiver interesse em colaborar, por favor entre em contato conosco ^^ ( contact@clawsouls.ai )