25 pontos por GN⁺ 21 일 전 | 1 comentários | Compartilhar no WhatsApp
  • Um conjunto combinável de APIs para construir e implantar agentes em grande escala na nuvem, permitindo levar protótipos para produção em poucos dias
  • Lida automaticamente com infraestrutura de nível de produção como sandbox de segurança, gerenciamento de credenciais e controle de permissões, para que o usuário possa focar apenas na definição das tarefas
  • Oferece suporte a sessões de longa duração, colaboração entre múltiplos agentes e governança baseada em confiança, além de integração estreita com os modelos Claude para execução iterativa autônoma e melhor desempenho
  • Empresas como Notion, Rakuten, Asana e Sentry já usam a solução para viabilizar implantações 10x mais rápidas e workflows automatizados
  • É oferecida em modelo de cobrança por uso e é uma plataforma que melhora de forma fundamental a eficiência operacional e a produtividade de desenvolvimento das organizações

Visão geral do Claude Managed Agents

  • Claude Managed Agents é um conjunto combinável de APIs para construir e implantar agentes em grande escala na nuvem, disponível em beta público
  • Antes, o desenvolvimento de agentes levava meses por causa de infraestrutura de segurança, gerenciamento de estado, controle de permissões e adaptação a upgrades de modelo; com o Managed Agents, é possível ir do protótipo à produção em poucos dias
  • Dá suporte desde executores de tarefa única até pipelines complexos com múltiplos agentes, permitindo que os usuários foquem na experiência do usuário sem overhead operacional

Construção e implantação de agentes 10x mais rápidas

  • Para implantar agentes em nível de produção, são necessários execução de código em sandbox, checkpoints, gerenciamento de credenciais, definição de escopos de permissão e rastreamento ponta a ponta
  • O Managed Agents assume essa complexidade, e o usuário precisa apenas definir tarefas, ferramentas e guardrails
  • Um harness de orquestração embutido automatiza o momento das chamadas de ferramentas, o gerenciamento de contexto e a recuperação de erros
  • Principais recursos:
    • Agentes de nível de produção: sandbox de segurança, autenticação e execução de ferramentas tratadas automaticamente
    • Sessões de longa duração: funcionam de forma autônoma por horas e mantêm progresso e saída mesmo se a conexão cair
    • Colaboração entre múltiplos agentes: criação e instrução de outros agentes para paralelizar tarefas complexas (em research preview)
    • Governança baseada em confiança: escopos de permissão, gerenciamento de identidade e rastreamento de execução integrados

Projeto integrado aos modelos Claude

  • Os modelos Claude são otimizados para tarefas centradas em agentes, e o Managed Agents foi projetado para aproveitar isso ao máximo
  • O usuário precisa apenas definir o resultado e os critérios de sucesso, e o Claude faz autoavaliação e iteração para atingir o objetivo (disponível em research preview)
  • Também há suporte, quando necessário, a workflows tradicionais de prompt-resposta
  • Em testes internos, tarefas de geração estruturada de arquivos mostraram ganho de até 10 pontos de desempenho em relação a loops padrão de prompt
  • Rastreamento de sessão, análises integradas e guias de troubleshooting estão embutidos no Claude Console, permitindo inspecionar todas as chamadas de ferramentas e decisões

Casos reais de uso

  • Diversas equipes estão alcançando implantações em produção 10x mais rápidas com o Managed Agents
    • Agentes de código: análise de codebase, planejamento de mudanças e geração de PRs
    • Agentes de produtividade: participação em projetos, execução de tarefas e entrega de resultados
    • Agentes financeiros e jurídicos: processamento de documentos e extração de informações-chave
  • Casos de empresas de destaque:
    • Notion

      • Opera uma versão alfa de Custom Agents que permite delegar tarefas diretamente ao Claude dentro do workspace
      • Engenheiros podem implantar código e knowledge workers podem criar sites e apresentações, com dezenas de tarefas executadas em paralelo
    • Rakuten

      • Implantou um agente corporativo integrado ao Slack e ao Teams nas áreas de produto, vendas, marketing, finanças e RH
      • Cada agente especializado foi implantado em menos de uma semana
    • Asana

      • Integra agentes que colaboram com humanos dentro dos projetos por meio do AI Teammates
      • Implementou recursos avançados em poucas semanas com Managed Agents
    • Vibecode

      • Implementou com Managed Agents uma infraestrutura de apps AI-native que conecta do prompt até a implantação do app
      • A mesma infraestrutura pode ser construída 10x mais rápido
    • Sentry

      • Combinou o agente de depuração Seer com um agente de escrita de patches baseado em Claude
      • Automatizou em um único fluxo desde a detecção do bug até a geração do PR, concluindo em semanas uma integração que antes levava meses

Depoimentos de clientes

  • Ansh Nanda (cofundador): antes era preciso gerenciar manualmente LLMs em sandbox, mas agora é possível construir infraestrutura 10x mais rápido com algumas linhas de código, e ele prevê uma explosão de apps AI-native
  • Indragie Karunaratne (diretor de engenharia de AI/ML da Sentry): o Managed Agents oferece um runtime seguro e totalmente gerenciado, melhorando a experiência do desenvolvedor e eliminando carga operacional
  • Sanchan Saxena (chefe de produto da Atlassian): ao integrar agentes ao workflow do Jira, a automação de sandboxing, sessões e gerenciamento de permissões elevou a eficiência de engenharia
  • Javed Qadrud-Din (CTO): o Managed Agents cria na hora as ferramentas necessárias para processar qualquer consulta de usuário, reduzindo o tempo de desenvolvimento em 10x
  • John Han (cofundador): foi possível implementar um agente de preparação de reuniões em nível de produção em poucos dias, com conexão a sistemas externos e busca na web tratadas automaticamente
  • Eric Liu (PM da Notion): sessões de longa duração e gerenciamento de memória permitem delegar tarefas complexas e abertas
  • Yusuke Kaji (líder de AI da Rakuten): agentes especializados para cada área foram implantados em uma semana, viabilizando expansão segura e democratização da inovação
  • Amritansh Raghav (CTO da Asana): acelerou fortemente a velocidade de desenvolvimento do AI Teammates, reforçando a experiência de colaboração em nível enterprise

Como começar

  • O Managed Agents é oferecido em modelo de cobrança por uso, com $0.08 por hora de sessão além da tarifa padrão de tokens da Claude Platform
  • Mais detalhes sobre preços estão na documentação oficial
  • É possível implantar o primeiro agente pelo Claude Console ou pela CLI, com suporte de integração ao Claude Code e ao Skill claude-api
  • O onboarding pode ser iniciado com o comando “start onboarding for managed agents in Claude API”

Inovação na operação das organizações

  • O Managed Agents é uma ferramenta capaz de transformar fundamentalmente a forma como as organizações operam,
    ajudando desenvolvedores e equipes a focarem em produtividade e experiência do usuário em vez de infraestrutura
  • Atualizações contínuas e expansão da comunidade estão previstas por meio da Claude Platform

1 comentários

 
GN⁺ 21 일 전
Opiniões do Hacker News
  • Suspeito que isso vá levar à orquestração ideal
    O open source pode não conseguir lançar uma alternativa melhor a tempo
    Até agora, o melhor desempenho apareceu quando se misturaram agentes de várias empresas
    Mais importante que o ‘planner’ é o ‘worker’. Alguns agentes são muito melhores em tarefas específicas
    Por exemplo, o Opus 4.6 nem se compara ao GPT 5.4 xhigh em detecção de bugs
    Assim como, no mundo real, formas diferentes de pensar aumentam a robustez de uma equipe, misturar agentes mostra um efeito parecido

    • Para a Anthropic fazer a melhor versão, ela teria que superar todas as outras empresas de IA em cada subtarefa detalhada (documentação técnica, diagramas, detecção de bugs etc.)
      Mas não parece que eles vão permitir chamar modelos externos como o Codex dentro da stack deles
    • O que me preocupa é a possibilidade de isso acabar virando a linguagem de orquestração ideal
      Por exemplo, e se o Claude convertesse toda a comunicação entre agentes para sumério?
      Uma empresa específica poderia acabar monopolizando a especialização nessa linguagem
    • Para mim também, o melhor sempre foi misturar modelos de várias empresas
      Escrever especificações com Opus → revisar com Gemini → feedback de novo com Opus → eu reviso → build com Qwen3.5 → review com Opus
      Esse fluxo era perfeito, mas a Anthropic mudou a política e quebrou isso
    • As empresas de IA agora parecem caranguejos num balde
      Quando uma empresa lança um modelo fechado, outras analisam, melhoram e liberam em open source
      No fim, ficam todas se atrapalhando e, mais tarde, isso pode até virar algo como um cartel
  • Dá para ver a Anthropic tentando puxar os desenvolvedores para a própria plataforma
    Para um IPO, ela precisa ser uma empresa de plataforma, não só uma fornecedora de modelos
    Todos os movimentos atuais apontam nessa direção

  • Uso o Claude Code todos os dias, mas deixar os sistemas dos clientes dependentes da Anthropic é arriscado
    Engenharia de qualidade não é exatamente o forte deles. E disponibilidade no nível de ‘single 9’ é problemática

  • Ainda estamos no comecinho dos frameworks de agentes, como a web antes do PHP
    Toda semana surgem novos padrões e modelos, e todos os frameworks são refeitos
    O LangChain quer virar algo como Next.js/Vercel, mas a maioria recomenda construir por conta própria
    Como a Anthropic tem os próprios modelos, ela vai captar alguma demanda com uma solução de baixa barreira de entrada, mas o lock-in e a velocidade das mudanças técnicas continuam sendo problemas

    • Também concordo. Estamos naquela fase em que há centenas de soluções meio prontas flutuando em blogs ou no GitHub
      O LangChain é o que chegou mais perto, mas ainda passa muito a sensação de faça você mesmo
      Além disso, todo mundo mistura vector DBs e modelos de reranking diferentes
  • Eu também estava construindo algo parecido por conta própria, então fiquei surpreso ao ver que a abordagem da Anthropic parecia uma ideia paralela
    É fundamental evitar ficar preso a um único provedor de modelo
    Para equipes pequenas talvez tudo bem, mas em sistemas complexos isso é suicídio
    É preciso comparar e combinar vários modelos e gerenciá-los no seu próprio estilo. É como cozinhar: dependendo da situação, você precisa escolher sabores diferentes

    • Na prática, todo mundo está construindo algo parecido. As direções possíveis são limitadas
    • Fico me perguntando se a razão para evitar lock-in é só desempenho, ou se também é porque a Anthropic pode usar os dados de telemetria e depois virar concorrente
    • Também penso assim. É bem simples subir esse tipo de sistema em cima de uma plataforma agregadora como o openrouter
  • A página feita por esses agentes ficou tão bagunçada que o texto dos depoimentos se sobrepunha, então dava para ler nada

    • Eu só via uma tela preta
  • Estou rodando um container Docker para criar um site Jekyll com o Anthropic Agentic SDK
    Montar a infraestrutura não foi difícil; a parte realmente difícil foi fazer o agente se comportar como eu queria
    Como talvez eu migre para outro provedor ou para self-hosting algum dia, quero manter minha liberdade

  • Eu ainda vou continuar usando a combinação pydantic ai + dbos/temporal/celery
    Não quero ficar preso a um fornecedor específico. Quero poder usar qualquer LLM livremente
    Precisamos continuar impulsionando a evolução da orquestração open source

  • Parece legal por fora, mas pode virar uma bomba de custos
    Como na AWS, se você descuidar, milhares de agentes vão ficar rodando e a conta vai explodir
    Para a Anthropic, isso parece um enorme modelo de receita

  • Essa direção era um passo esperado
    É uma forma fácil de aumentar a receita e reforçar o lock-in do usuário sem precisar deixar os modelos mais inteligentes
    A análise relacionada está bem resumida neste texto