36 pontos por GN⁺ 20 일 전 | 1 comentários | Compartilhar no WhatsApp
  • A estratégia Advisor foi oficialmente introduzida na Claude Platform — um padrão que combina o Opus como advisor e o Sonnet ou Haiku como executor, aplicando ao agente uma capacidade de raciocínio próxima ao nível do Opus com custo menor
  • Quando combinado com um advisor Opus, o Sonnet teve melhora de 2,7 p.p. na pontuação do SWE-bench Multilingual em relação à execução isolada, e o custo por tarefa de agente caiu 11,9%
  • A combinação Haiku + advisor Opus registrou 41,2% no BrowseComp, mais que o dobro do Haiku sozinho (19,7%), enquanto reduziu o custo em 85% em comparação com o Sonnet sozinho
  • Ao declarar a ferramenta advisor_20260301 em uma requisição da Messages API, a transferência entre modelos é concluída dentro de uma única requisição /v1/messages, funcionando sem rodadas adicionais nem gerenciamento de contexto
  • Os tokens do advisor são cobrados pela tarifa do modelo advisor, e os tokens do executor pela tarifa do modelo executor, em uma estrutura que permite rastreamento e controle de custos

Visão geral da estratégia Advisor

  • Sonnet ou Haiku atuam como executor, realizando a tarefa do início ao fim e ficando responsáveis por chamadas de ferramentas, leitura de resultados e trabalho iterativo
  • Quando o executor chega a uma decisão difícil de resolver de forma razoável, ele solicita orientação ao Opus, e o Opus retorna um dos seguintes sinais com base no contexto compartilhado: plano, revisão ou interrupção
  • O advisor (Opus) não chama ferramentas diretamente nem gera saída voltada ao usuário; ele fornece apenas orientação ao executor
  • Essa estrutura inverte o padrão tradicional de subagentes, em que um grande modelo orquestrador divide o trabalho e o delega a modelos menores, funcionando sem pool separado de workers nem lógica de orquestração
  • O raciocínio em nível frontier é aplicado apenas quando o executor precisa, enquanto o restante da execução permanece no custo do modelo executor

Resultados de avaliação de desempenho

  • A combinação Sonnet + advisor Opus apresentou melhora de 2,7 p.p. no SWE-bench Multilingual em relação ao Sonnet sozinho, com redução de 11,9% no custo por tarefa de agente
  • Também houve aumento de pontuação nos benchmarks BrowseComp e Terminal-Bench 2.0 em comparação com o Sonnet sozinho, com menor custo por tarefa
  • Haiku + advisor Opus: pontuação de 41,2% no BrowseComp — mais que o dobro do Haiku sozinho (19,7%)
    • A pontuação ficou 29% abaixo do Sonnet sozinho, mas o custo por tarefa foi 85% menor
    • Há aumento de custo em relação ao Haiku sozinho ao adicionar o advisor, mas o custo combinado ainda fica muito abaixo do Sonnet

Como usar a ferramenta Advisor

  • Ao declarar advisor_20260301 em uma requisição da Messages API, a transferência entre modelos é concluída dentro de uma única requisição /v1/messages — sem necessidade de rodadas adicionais nem gerenciamento de contexto
  • O modelo executor decide por conta própria quando chamar o advisor; um contexto selecionado é enviado ao modelo advisor, que retorna um plano
  • O parâmetro max_uses permite definir o limite máximo de chamadas ao advisor por requisição
  • Os tokens do advisor são reportados separadamente no bloco usage, permitindo rastrear gastos por tier
  • Pode ser usado no mesmo loop que ferramentas existentes, como busca na web e execução de código
response = client.messages.create(  
    model="claude-sonnet-4-6",  # executor  
    tools=[  
        {  
            "type": "advisor_20260301",  
            "name": "advisor",  
            "model": "claude-opus-4-6",  
            "max_uses": 3,  
        },  
        # ... your other tools  
    ],  
    messages=[...]  
)  

Estrutura de preços

  • Os tokens do advisor são cobrados pela tarifa do modelo advisor (Opus), enquanto os tokens do executor são cobrados pela tarifa do modelo executor (Sonnet/Haiku)
  • Como o advisor gera apenas planos curtos (normalmente 400~700 tokens de texto) e toda a saída final é processada pelo executor a um custo menor, o custo total permanece muito abaixo de executar apenas o modelo advisor

Feedback de usuários

  • Engenheiro de ML da Eve Legal: "O Haiku 4.5 escala dinamicamente sua inteligência consultando o Opus 4.6 conforme a complexidade, alcançando qualidade de nível frontier com custo 5x menor"
  • CEO da Bolt: "Toma decisões de arquitetura melhores em tarefas complexas e não adiciona overhead em tarefas simples — a diferença no planejamento e na trajetória de execução é nítida"
  • CTO da Genspark: "Melhorias claras em turns do agente, chamadas de ferramentas e pontuação geral — resultados superiores à nossa ferramenta de planejamento desenvolvida internamente"

Primeiros passos

  • Atualmente disponível em beta na Claude Platform
  • Procedimento para começar:
    1. Adicionar o cabeçalho da funcionalidade beta: anthropic-beta: advisor-tool-2026-03-01
    2. Adicionar advisor_20260301 à requisição da Messages API
    3. Ajustar o prompt de sistema ao seu caso de uso
  • Recomenda-se comparar três configurações com seu eval suite existente: Sonnet sozinho / Sonnet + advisor Opus / Opus sozinho

1 comentários

 
heycalmdown 20 일 전

Embora não seja uma ideia particularmente nova neste momento, acho que é uma boa abordagem por poder ser executada sem quebrar a assinatura da interface nem o fluxo de trabalho.