Estratégia Advisor: elevando a inteligência do Sonnet com o Opus como conselheiro

(claude.com)

36 pontos por GN⁺ 20 일 전 | 1 comentários | Compartilhar no WhatsApp

A estratégia Advisor foi oficialmente introduzida na Claude Platform — um padrão que combina o Opus como advisor e o Sonnet ou Haiku como executor, aplicando ao agente uma capacidade de raciocínio próxima ao nível do Opus com custo menor
Quando combinado com um advisor Opus, o Sonnet teve melhora de 2,7 p.p. na pontuação do SWE-bench Multilingual em relação à execução isolada, e o custo por tarefa de agente caiu 11,9%
A combinação Haiku + advisor Opus registrou 41,2% no BrowseComp, mais que o dobro do Haiku sozinho (19,7%), enquanto reduziu o custo em 85% em comparação com o Sonnet sozinho
Ao declarar a ferramenta advisor_20260301 em uma requisição da Messages API, a transferência entre modelos é concluída dentro de uma única requisição /v1/messages, funcionando sem rodadas adicionais nem gerenciamento de contexto
Os tokens do advisor são cobrados pela tarifa do modelo advisor, e os tokens do executor pela tarifa do modelo executor, em uma estrutura que permite rastreamento e controle de custos

Visão geral da estratégia Advisor

Sonnet ou Haiku atuam como executor, realizando a tarefa do início ao fim e ficando responsáveis por chamadas de ferramentas, leitura de resultados e trabalho iterativo
Quando o executor chega a uma decisão difícil de resolver de forma razoável, ele solicita orientação ao Opus, e o Opus retorna um dos seguintes sinais com base no contexto compartilhado: plano, revisão ou interrupção
O advisor (Opus) não chama ferramentas diretamente nem gera saída voltada ao usuário; ele fornece apenas orientação ao executor
Essa estrutura inverte o padrão tradicional de subagentes, em que um grande modelo orquestrador divide o trabalho e o delega a modelos menores, funcionando sem pool separado de workers nem lógica de orquestração
O raciocínio em nível frontier é aplicado apenas quando o executor precisa, enquanto o restante da execução permanece no custo do modelo executor

Resultados de avaliação de desempenho

A combinação Sonnet + advisor Opus apresentou melhora de 2,7 p.p. no SWE-bench Multilingual em relação ao Sonnet sozinho, com redução de 11,9% no custo por tarefa de agente
Também houve aumento de pontuação nos benchmarks BrowseComp e Terminal-Bench 2.0 em comparação com o Sonnet sozinho, com menor custo por tarefa
Haiku + advisor Opus: pontuação de 41,2% no BrowseComp — mais que o dobro do Haiku sozinho (19,7%)
- A pontuação ficou 29% abaixo do Sonnet sozinho, mas o custo por tarefa foi 85% menor
- Há aumento de custo em relação ao Haiku sozinho ao adicionar o advisor, mas o custo combinado ainda fica muito abaixo do Sonnet

Como usar a ferramenta Advisor

Ao declarar advisor_20260301 em uma requisição da Messages API, a transferência entre modelos é concluída dentro de uma única requisição /v1/messages — sem necessidade de rodadas adicionais nem gerenciamento de contexto
O modelo executor decide por conta própria quando chamar o advisor; um contexto selecionado é enviado ao modelo advisor, que retorna um plano
O parâmetro max_uses permite definir o limite máximo de chamadas ao advisor por requisição
Os tokens do advisor são reportados separadamente no bloco usage, permitindo rastrear gastos por tier
Pode ser usado no mesmo loop que ferramentas existentes, como busca na web e execução de código

response = client.messages.create(  
    model=&quot;claude-sonnet-4-6&quot;,  # executor  
    tools=[  
        {  
            &quot;type&quot;: &quot;advisor_20260301&quot;,  
            &quot;name&quot;: &quot;advisor&quot;,  
            &quot;model&quot;: &quot;claude-opus-4-6&quot;,  
            &quot;max_uses&quot;: 3,  
        },  
        # ... your other tools  
    ],  
    messages=[...]  
)

Estrutura de preços

Os tokens do advisor são cobrados pela tarifa do modelo advisor (Opus), enquanto os tokens do executor são cobrados pela tarifa do modelo executor (Sonnet/Haiku)
Como o advisor gera apenas planos curtos (normalmente 400~700 tokens de texto) e toda a saída final é processada pelo executor a um custo menor, o custo total permanece muito abaixo de executar apenas o modelo advisor

Feedback de usuários

Engenheiro de ML da Eve Legal: "O Haiku 4.5 escala dinamicamente sua inteligência consultando o Opus 4.6 conforme a complexidade, alcançando qualidade de nível frontier com custo 5x menor"
CEO da Bolt: "Toma decisões de arquitetura melhores em tarefas complexas e não adiciona overhead em tarefas simples — a diferença no planejamento e na trajetória de execução é nítida"
CTO da Genspark: "Melhorias claras em turns do agente, chamadas de ferramentas e pontuação geral — resultados superiores à nossa ferramenta de planejamento desenvolvida internamente"

Primeiros passos

Atualmente disponível em beta na Claude Platform
Procedimento para começar:
1. Adicionar o cabeçalho da funcionalidade beta: anthropic-beta: advisor-tool-2026-03-01
2. Adicionar advisor_20260301 à requisição da Messages API
3. Ajustar o prompt de sistema ao seu caso de uso
Recomenda-se comparar três configurações com seu eval suite existente: Sonnet sozinho / Sonnet + advisor Opus / Opus sozinho

1 comentários

heycalmdown 20 일 전

Embora não seja uma ideia particularmente nova neste momento, acho que é uma boa abordagem por poder ser executada sem quebrar a assinatura da interface nem o fluxo de trabalho.