HyperAgents da Meta — quando agentes projetam o próprio harness

(cobusgreyling.medium.com)

45 pontos por GN⁺ 18 일 전 | 3 comentários | Compartilhar no WhatsApp

HyperAgents, apresentados em conjunto pela Meta e pela UBC, são um framework de agentes de IA autorreferenciais que modificam não só o código de execução de tarefas, mas também o próprio mecanismo de melhoria
Ao repetir a autoaperfeiçoamento em diversos domínios, como programação, revisão de artigos, robótica e correção de matemática, os agentes passaram a inventar de forma independente memória persistente, rastreamento de desempenho e pipelines de verificação em múltiplas etapas
Esses componentes construídos pelos próprios agentes correspondem exatamente aos elementos centrais de um harness de produção que antes era criado manualmente por desenvolvedores
O harness não é apenas uma conveniência de desenvolvimento, mas uma arquitetura convergente de sistemas agentivos, e os agentes estão deixando de ser consumidores de infraestrutura para se tornarem produtores
O papel do desenvolvedor muda de construir diretamente o harness para projetar as condições iniciais que permitam ao agente evoluir um harness eficaz

Visão geral do HyperAgents

No novo artigo da Meta e da UBC, HyperAgents são agentes autorreferenciais (self-referential) que podem modificar não apenas os comportamentos de resolução de tarefas, mas também o próprio mecanismo que gera melhorias futuras
O ponto de destaque é o resultado para o qual os agentes convergem quando são deixados para se autoaperfeiçoar: eles reinventam os mesmos componentes que hoje os desenvolvedores constroem manualmente
Hyperagent é definido como um produtor (producer) de infraestrutura

HyperAgents vs Universal Agents

Um Universal Agent é um executor altamente adaptável que resolve quase qualquer problema de forma improvisada escrevendo código, mas ainda opera dentro de uma infraestrutura (harness) projetada por humanos
Um Hyperagent, como produtor de infraestrutura, começa de um estado mínimo e faz bootstrap de um harness de nível de produção por conta própria por meio de evolução autorreferencial

Definição de harness e componentes centrais

O harness é o sistema de software que governa a forma de operação de um agente de IA, gerenciando ferramentas, memória, tentativas, engenharia de contexto e verificação para que o modelo possa se concentrar no raciocínio
Os 6 componentes centrais necessários em um harness de produção:
- Tool Integration: registro e execução de ferramentas
- Memory & State: persistência de resultados entre etapas
- Context Engineering: montagem dinâmica de prompts
- Planning: decomposição de tarefas complexas em etapas
- Verification: validação das saídas em relação a regras
- Modularity: alternância independente de componentes
Tradicionalmente, esta era uma área de engenharia humana, em que desenvolvedores escreviam diretamente classes como ToolRegistry, MemoryManager, loops de retry e lógica de montagem de prompts
A pergunta levantada pelo artigo sobre HyperAgents é: “o que acontece quando o agente constrói esses componentes por conta própria?”

Como o HyperAgents funciona

O framework apresentado no artigo é o DGM-Hyperagents (DGM-H), e a ideia central é simples
O Hyperagent é um único programa editável que inclui duas partes:
- o Task Agent, que resolve a tarefa dada
- o Meta Agent, que modifica o Task Agent e a si próprio
A palavra-chave é “itself”: o Meta Agent pode reescrever o próprio código, e o mecanismo que gera melhorias também se torna alvo de melhoria
O artigo chama isso de metacognitive self-modification
O funcionamento ocorre por meio de um loop evolutivo:
- começa com um agente básico
- o Meta Agent lê o código do agente, analisa o desempenho passado e gera uma versão modificada
- a versão modificada é avaliada e, se tiver melhor desempenho, é adicionada ao arquivo
- uma opção é escolhida do arquivo e o processo se repete
Após centenas de repetições, o agente não apenas fica melhor na tarefa, como também melhora sua própria capacidade de melhorar

Componentes que emergiram da autoaperfeiçoamento

Como resultado da autoaperfeiçoamento em vários domínios, como programação, revisão de artigos, design de recompensas em robótica e correção de matemática olímpica, os agentes inventaram de forma independente os seguintes elementos:

Memória persistente (Persistent Memory)

Sem instruções do desenvolvedor, o agente evoluiu por conta própria um sistema de memória
Isso aconteceu porque agentes capazes de lembrar resultados passados, rastrear tendências de desempenho e armazenar insights consolidados superaram os que não conseguiam
Exemplos de itens de memória apresentados no artigo: armazenamento de hipóteses causais, identificação da geração de melhor desempenho, diagnóstico de over-editing e sugestão de como combinar estratégias bem-sucedidas

Rastreamento de desempenho (Performance Tracking)

O agente construiu por conta própria sua própria observabilidade (observability)
Isso inclui média móvel de tendências de melhoria, estatísticas agregadas por geração e histórico de pontuação por domínio
É funcionalmente idêntico ao rastreamento de tokens e audit logging que desenvolvedores implementam manualmente em um harness

Pipelines de avaliação em múltiplas etapas (Multi-stage Evaluation Pipelines)

No domínio de revisão de artigos, o agente evoluiu de instruções superficiais de comportamento para um pipeline explícito de avaliação em múltiplas etapas
Incluindo checklist, regras de decisão e critérios claramente definidos
Isso é resultado de o agente ter construído por conta própria um verifier

Protocolos de decisão com limiares (Decision Protocols with Thresholds)

O agente desenvolveu limites explícitos de decisão: proporções de aceitação/rejeição, limiares de pontuação e níveis de confiança
Isso corresponde exatamente às checagens baseadas em regras implementadas por verificadores de harness

Bases de conhecimento de domínio (Domain Knowledge Bases)

No design de recompensas em robótica, o agente construiu e refinou gradualmente uma base interna de conhecimento com restrições do ambiente, variáveis de estado válidas e heurísticas de escalonamento de recompensas
Isso é resultado de engenharia de contexto aprendida pelo agente para montar o contexto correto para si mesmo

Retry e autocorreção (Retry and Self-Correction)

Quando uma modificação do agente piorava o desempenho, gerações seguintes diagnosticavam a regressão e faziam a correção
É o mesmo padrão dos loops de retry com injeção de feedback implementados por harnesses

O quadro maior — tendências convergindo em uma mesma direção

O padrão rastreado em várias pesquisas converge em um mesmo fluxo:
- Harness Engineering: define os 6 componentes que desenvolvedores constroem em torno do agente
- From Copilot to Codex: a transição de código escrito por humanos para código delegado a agentes
- Universal Agents: a tese de que capacidade de programação torna agentes universais
- HyperAgents: agentes constroem o próprio harness por meio de automodificação
Os agentes estão passando de consumidores de infraestrutura para produtores, e de executar dentro de um harness para engenheirar o próprio harness
A demonstração concreta do artigo do DGM-H: começando de um agente básico com apenas uma chamada única de LLM, após centenas de repetições de automodificação ele evolui para um sistema com memória persistente, rastreamento de desempenho, pipeline de avaliação em múltiplas etapas, base de conhecimento de domínio e estrutura de código modular
O papel do desenvolvedor não está desaparecendo, mas mudando, e o artigo enfatiza que a supervisão humana continua essencial
O papel muda de construir diretamente o harness para projetar as condições iniciais que permitam ao agente evoluir um harness eficaz

3 comentários

geesecross 18 일 전

A reinvenção dos componentes do harness me parece mais um resultado de terem seguido precedentes que já podiam ser amplamente encontrados, como por meio de buscas na web, do que uma convergência inevitável.

Talvez só se possa chamar isso de convergência de arquitetura se eles tivessem conseguido reinventar os componentes de um agente de IA em uma situação em que o aprendizado e o acesso fossem limitados apenas a dados do passado.

ng0301 17 일 전

Será que esse é o começo da Skynet? kkk

ilfjh 17 일 전

Isso faz algum sentido??...