- A estratégia Advisor foi oficialmente introduzida na Claude Platform — um padrão que combina o Opus como advisor e o Sonnet ou Haiku como executor, aplicando ao agente uma capacidade de raciocínio próxima ao nível do Opus com custo menor
- Quando combinado com um advisor Opus, o Sonnet teve melhora de 2,7 p.p. na pontuação do SWE-bench Multilingual em relação à execução isolada, e o custo por tarefa de agente caiu 11,9%
- A combinação Haiku + advisor Opus registrou 41,2% no BrowseComp, mais que o dobro do Haiku sozinho (19,7%), enquanto reduziu o custo em 85% em comparação com o Sonnet sozinho
- Ao declarar a ferramenta advisor_20260301 em uma requisição da Messages API, a transferência entre modelos é concluída dentro de uma única requisição
/v1/messages, funcionando sem rodadas adicionais nem gerenciamento de contexto
- Os tokens do advisor são cobrados pela tarifa do modelo advisor, e os tokens do executor pela tarifa do modelo executor, em uma estrutura que permite rastreamento e controle de custos
Visão geral da estratégia Advisor
- Sonnet ou Haiku atuam como executor, realizando a tarefa do início ao fim e ficando responsáveis por chamadas de ferramentas, leitura de resultados e trabalho iterativo
- Quando o executor chega a uma decisão difícil de resolver de forma razoável, ele solicita orientação ao Opus, e o Opus retorna um dos seguintes sinais com base no contexto compartilhado: plano, revisão ou interrupção
- O advisor (Opus) não chama ferramentas diretamente nem gera saída voltada ao usuário; ele fornece apenas orientação ao executor
- Essa estrutura inverte o padrão tradicional de subagentes, em que um grande modelo orquestrador divide o trabalho e o delega a modelos menores, funcionando sem pool separado de workers nem lógica de orquestração
- O raciocínio em nível frontier é aplicado apenas quando o executor precisa, enquanto o restante da execução permanece no custo do modelo executor
Resultados de avaliação de desempenho
- A combinação Sonnet + advisor Opus apresentou melhora de 2,7 p.p. no SWE-bench Multilingual em relação ao Sonnet sozinho, com redução de 11,9% no custo por tarefa de agente
- Também houve aumento de pontuação nos benchmarks BrowseComp e Terminal-Bench 2.0 em comparação com o Sonnet sozinho, com menor custo por tarefa
- Haiku + advisor Opus: pontuação de 41,2% no BrowseComp — mais que o dobro do Haiku sozinho (19,7%)
- A pontuação ficou 29% abaixo do Sonnet sozinho, mas o custo por tarefa foi 85% menor
- Há aumento de custo em relação ao Haiku sozinho ao adicionar o advisor, mas o custo combinado ainda fica muito abaixo do Sonnet
Como usar a ferramenta Advisor
- Ao declarar advisor_20260301 em uma requisição da Messages API, a transferência entre modelos é concluída dentro de uma única requisição
/v1/messages — sem necessidade de rodadas adicionais nem gerenciamento de contexto
- O modelo executor decide por conta própria quando chamar o advisor; um contexto selecionado é enviado ao modelo advisor, que retorna um plano
- O parâmetro max_uses permite definir o limite máximo de chamadas ao advisor por requisição
- Os tokens do advisor são reportados separadamente no bloco
usage, permitindo rastrear gastos por tier
- Pode ser usado no mesmo loop que ferramentas existentes, como busca na web e execução de código
response = client.messages.create(
model="claude-sonnet-4-6", # executor
tools=[
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
"max_uses": 3,
},
# ... your other tools
],
messages=[...]
)
Estrutura de preços
- Os tokens do advisor são cobrados pela tarifa do modelo advisor (Opus), enquanto os tokens do executor são cobrados pela tarifa do modelo executor (Sonnet/Haiku)
- Como o advisor gera apenas planos curtos (normalmente 400~700 tokens de texto) e toda a saída final é processada pelo executor a um custo menor, o custo total permanece muito abaixo de executar apenas o modelo advisor
Feedback de usuários
- Engenheiro de ML da Eve Legal: "O Haiku 4.5 escala dinamicamente sua inteligência consultando o Opus 4.6 conforme a complexidade, alcançando qualidade de nível frontier com custo 5x menor"
- CEO da Bolt: "Toma decisões de arquitetura melhores em tarefas complexas e não adiciona overhead em tarefas simples — a diferença no planejamento e na trajetória de execução é nítida"
- CTO da Genspark: "Melhorias claras em turns do agente, chamadas de ferramentas e pontuação geral — resultados superiores à nossa ferramenta de planejamento desenvolvida internamente"
Primeiros passos
- Atualmente disponível em beta na Claude Platform
- Procedimento para começar:
- Adicionar o cabeçalho da funcionalidade beta:
anthropic-beta: advisor-tool-2026-03-01
- Adicionar
advisor_20260301 à requisição da Messages API
- Ajustar o prompt de sistema ao seu caso de uso
- Recomenda-se comparar três configurações com seu eval suite existente: Sonnet sozinho / Sonnet + advisor Opus / Opus sozinho
1 comentários
Embora não seja uma ideia particularmente nova neste momento, acho que é uma boa abordagem por poder ser executada sem quebrar a assinatura da interface nem o fluxo de trabalho.