130 pontos por xguru 2026-03-29 | 7 comentários | Compartilhar no WhatsApp
  • Com apenas a frase "configure um harness para mim", ele projeta uma equipe de agentes especialistas adequada ao domínio e ainda gera automaticamente até as skills que os agentes vão usar, como uma meta-skill
  • Suporta 6 padrões de arquitetura e inclui orquestração entre agentes e protocolos de tratamento de erros
  • Padrões de arquitetura
    • Pipeline: tarefas sequenciais e dependentes
    • Fan-out/Fan-in: tarefas independentes em paralelo
    • Pool de especialistas: chamada seletiva conforme o contexto
    • Geração-validação: gera primeiro e depois faz a revisão de qualidade
    • Supervisor: um agente central faz a distribuição dinâmica
    • Delegação hierárquica: delegação recursiva do nível superior para o inferior
  • Workflow em 6 etapas: análise do domínio → projeto da arquitetura da equipe (equipe de agentes vs. subagentes) → geração das definições dos agentes → geração de skills → integração e orquestração → validação e testes
  • Há dois modos de execução:
    • Equipe de agentes (padrão): método TeamCreate + SendMessage + TaskCreate, recomendado quando são necessários 2 ou mais agentes e colaboração
    • Subagentes: chamada direta da ferramenta Agent, adequada para tarefas pontuais e quando não é necessária comunicação
  • Ao executar o Harness, arquivos de definição de agentes são criados automaticamente em .claude/agents/ (ex.: analyst.md, builder.md, qa.md), e os arquivos de skills em .claude/skills/
  • Exemplos de equipes que podem ser geradas
    • Pesquisa aprofundadaconfigure um harness de pesquisa para mim. Preciso de uma equipe de agentes capaz de investigar qualquer tema por múltiplos ângulos — busca na web, materiais acadêmicos, reação da comunidade — e depois redigir um relatório consolidado após validação cruzada.
    • Criação de websiteconfigure um harness de desenvolvimento de website full-stack para mim. Uma equipe que coordene design, frontend (React/Next.js), backend (API) e testes de QA em um pipeline, do wireframe até o deploy.
    • Produção de webtoonconfigure um harness de produção de episódio de webtoon para mim. Preciso de agentes para escrita da história, prompts de design de personagens, planejamento de layout dos painéis e edição de diálogos, e eles devem revisar o trabalho uns dos outros do ponto de vista de consistência de estilo.
    • Planejamento de conteúdo para YouTubeconfigure um harness de produção de conteúdo para YouTube para mim. Uma equipe em que um agente supervisor coordene pesquisa de tendências, redação de roteiro, otimização de SEO para título/tags e planejamento do conceito da thumbnail.
    • Code reviewconfigure um harness abrangente de revisão de código para mim. Uma equipe em que agentes auditem em paralelo arquitetura, vulnerabilidades de segurança, gargalos de performance e estilo de código, integrando os resultados em um único relatório.
    • Redação de documentação técnicaconfigure um harness para gerar automaticamente documentação de API a partir deste codebase. Uma equipe que processe em pipeline análise de endpoints, redação das explicações, geração de exemplos de uso e revisão de completude.
    • Projeto de pipeline de dadosconfigure um harness de projeto de pipeline de dados para mim. Uma equipe de agentes que delegue hierarquicamente modelagem de esquema, lógica de ETL, regras de validação de dados e configuração de monitoramento.
    • Campanha de marketingconfigure um harness de criação de campanha de marketing para mim. Uma equipe que conduza pesquisa do mercado-alvo, redação de copy de anúncios, design de conceito visual e planejamento de testes A/B com revisões iterativas de qualidade.
  • revfactory/harness-100 — lançamento de 100 harnesses de equipes de agentes prontos para produção em 10 domínios (200 pacotes em coreano e inglês)
    • Cada harness inclui 4 a 5 agentes especialistas, skills de orquestrador e skills especializadas no domínio
    • Composto por 1.808 arquivos Markdown cobrindo criação de conteúdo, desenvolvimento de software, dados/IA, estratégia de negócios, educação, área jurídica, saúde etc.
    • Todos foram gerados com o plugin Harness
  • É necessário ativar a função de equipes de agentes do Claude Code: CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

7 comentários

 
namojo 29 일 전

O resultado no uso real é impressionante. A própria estrutura do Harness, criado pelo Minho, faz fan-in/fan-out, gera vários multiagentes conforme o objetivo e alinhados às instruções, e o orquestrador que os gerencia decompõe cada etapa do trabalho em várias fases para executá-las.

O nível dos resultados é de quase especialista: pode produzir desde relatórios até aplicações completas, com agentes em diversos papéis — como programador, testador, revisor e analista — atuando em alto nível.

Você pode pensar que, como no MCP ou em outras ferramentas, o Harness mantém um contexto muito grande o tempo todo e consome tokens rapidamente, mas ao abrir o contexto dá para ver que ele está sendo usado com o máximo de eficiência. Ainda assim, para chegar ao nível de legibilidade ou de resultado refinado que imaginamos, seria preciso criar e acoplar uma Skill de geração de imagens Nanobanana baseada na API do Gemini.

Mesmo com o Claude Max 200, provavelmente o limite diário vem em 1 a 2 horas, e eu usei o Opus.

Este foi o resultado quando pedi para informar um roteiro de viagem ao Japão e criar, como um guia de viagem do Japão, uma página interativa de itinerário. Esse tipo de coisa usa poucos tokens e fica pronto rapidinho.

http://namojo.github.io/tokyo-tour

 
tested 2026-03-30

Alguém que já usou pode compartilhar impressões?

 
xguru 2026-03-29

Foi feito pelo Minho Hwang, líder da equipe de estratégia AI Native da Kakao.
Eu já tinha visto alguns posts em que ele apresentava isso, então estava esperando para ver quando seria lançado publicamente.
Vou experimentar!

 
edunga1 23 일 전

Se você já usa a equipe de agentes do Claude Code, não havia nada de particularmente novo.
Mas foi conveniente estruturar a infraestrutura usando agents e skills para que informações como a composição da equipe pudessem continuar disponíveis em novas sessões também.
Quando a equipe era montada manualmente, coisas como boilerplates para a equipe acabavam se repetindo.

Havia um problema: como o ambiente considerava tanto subagents quanto agent teams, no padrão Supervisor às vezes acontecia a situação estranha de o supervisor delegar trabalho a um subagent mesmo com a equipe já criada.

 
neocode24 2026-03-31

É no máximo 100, mas assim que comecei já atingi o limite de tokens T_T

 
neocode24 29 일 전

Reservei um tempo e organizei o que apliquei. Testei isso em um monorepo real de VibeCoding.

Entre os modos A (desenvolvimento), B (auditoria de código) e C (integração: A+B), como era um projeto já em andamento, prossegui com o Modo B.
Foi possível encontrar itens que a análise estática não consegue detectar, como incompatibilidades de tipo entre frontend e backend.
Organizei o processo de aplicação.

https://blog.neocode24.com/blog/claude-code-harness-real-world/

 
wang3281 2026-03-30

Como alguém que está criando o Harness por conta própria, fico curioso sobre que tipo de testes mostram os resultados dos efeitos da adoção de projetos open source. Existe alguma ferramenta de benchmark quantificada e oficial? Também queria saber como as outras pessoas costumam validar a eficácia, e não apenas pela sensação.