1 pontos por GN⁺ 2025-04-17 | 1 comentários | Compartilhar no WhatsApp
  • 12 Factor Agents apresenta princípios para construir aplicações com LLM confiáveis
  • Com base na experiência de uso de frameworks de agentes de IA, conclui-se que a maioria dos produtos não são agentes de verdade
  • 12 Factor Agents explora como tornar software baseado em LLM bom o suficiente para ser entregue a clientes
  • Os 12 fatores incluem técnicas essenciais para melhorar a confiabilidade, a escalabilidade e a manutenibilidade de software com LLM
  • Integrar conceitos modulares a produtos existentes é a forma de entregar rapidamente software de IA de alta qualidade

12 Factor Agents - Princípios para construir aplicações com LLM confiáveis

  • Com base na experiência de uso de frameworks de agentes de IA, conclui-se que a maioria dos produtos não são agentes de verdade
  • 12 Factor Agents explora como tornar software baseado em LLM bom o suficiente para ser entregue a clientes
  • Os 12 fatores incluem técnicas essenciais para melhorar a confiabilidade, a escalabilidade e a manutenibilidade de software com LLM
  • Integrar conceitos modulares a produtos existentes é a forma de entregar rapidamente software de IA de alta qualidade

Resumo: 12 fatores

  • Transformar linguagem natural em chamadas de ferramentas: entender como usar linguagem natural para acionar ferramentas
  • Ter posse do prompt: é importante ter controle e gerenciamento do prompt
  • Ter posse da janela de contexto: é importante ter controle e gerenciamento da janela de contexto
  • Ferramentas são saídas estruturadas: ferramentas devem ser tratadas como saídas estruturadas
  • Integrar estado de execução e estado de negócio: gerenciar de forma integrada o estado de execução e o estado de negócio

A promessa dos agentes

  • DAG (Directed Acyclic Graph): o software pode ser representado como um grafo direcionado, e orquestradores de DAG ganharam popularidade
  • A promessa dos agentes: com agentes, é possível abandonar o DAG e deixar que o LLM decida o caminho em tempo real
  • Agentes operam em loop: agentes funcionam em um loop no qual o LLM decide a próxima etapa, executa chamadas de ferramentas e adiciona os resultados à janela de contexto

Por que 12-factor agents?

  • Limitações dos frameworks existentes: muitos construtores de SaaS tentam criar agentes, mas é difícil atingir mais de 80% de qualidade devido às limitações dos frameworks existentes
  • Importância dos conceitos modulares: integrar conceitos modulares a produtos existentes é a forma de entregar rapidamente software de IA de alta qualidade

Padrões de design para ótimas aplicações com LLM

  • Elementos centrais dos agentes: existem elementos centrais que tornam um agente excelente, e ao usar um framework é possível obter a maioria deles
  • Integração de conceitos modulares: integrar conceitos modulares a produtos existentes é a forma de entregar rapidamente software de IA de alta qualidade

Recursos relacionados

  • Podcast Tool Use: o tema é abordado no episódio de março de 2025
  • The Outer Loop: blog que trata do tema
  • Webinar: webinar com @hellovai sobre maximização de desempenho de LLM
  • Agente open source: um agente OSS foi construído usando essa metodologia

1 comentários

 
GN⁺ 2025-04-17
Comentários do Hacker News
  • Wiki muito útil. Obrigado, com certeza vou usar. Ontem mesmo lancei um "framework de AI Agents". Esse framework é baseado no modelo de atores, máquinas de estado e programação orientada a perspectivas. Gostei especialmente dos pontos 5 e 7

    • unificar o estado de execução e o estado de negócio
    • ser dono do próprio fluxo de controle
    • O SecAI faz isso bem, e como biblioteca de fluxo de controle em grafo, as chamadas de LLM ficam embutidas nos nós do grafo. O fluxo é fortalecido por negociação, cancelamento e relações de estado, ficando mais orgânico
    • algo que outros frameworks costumam deixar passar são ferramentas de desenvolvimento dedicadas. Programar falhas, inspecionar cada etapa em detalhe e oferecer exportação automática de dados e integrações simples
    • lancei a primeira demo técnica, incluindo uma implementação de referência que mostra todas as ferramentas de desenvolvimento
    • o botão Send/Stop permite iniciar/pausar/retomar com uma API simples. Tem transparência de rede e pode escalar
  • Excelente. Trabalhando nisso há alguns anos, acabei criando minha própria lista de lições. A mais importante é ser dono do loop de planejamento de nível mais baixo

    • tudo bem ter planejamento dinâmico, mas você precisa ser dono do loop OODA e ter heurísticas para decidir se está convergindo para uma solução
    • você precisa embutir um motor de workflow e fazer o modelo construir especificações de workflow que rodem nesse motor
  • Ainda bem que esse material saiu neste momento. Obrigado

    • estou imaginando um sandbox audiovisual como o vvvv. A ideia é inserir nós de LM ou de redes neurais locais simples para executar tarefas específicas, com a saída sendo muito limitada
    • o fluxo de pergunta para resposta é muito atraente. Pipelines de múltiplas etapas também são muito interessantes
  • Tenho curiosidade sobre como bibliotecas como DSPY se encaixam no factor-2

    • vi um exemplo de uso do BAML para gerar prompts. Escrever prompts manualmente para extrair informação estruturada de dados não estruturados não é fácil
    • queria saber o que acham de usar prompts brutos do DSPY
  • É um post de blog antigo, mas o conteúdo sobre padrões de framework ressoa com toda a minha carreira. É melhor usar LLMs como biblioteca do que como framework

    • frameworks são mais atraentes e mais fáceis de vender, e levam a lock-in e serviços adicionais
  • Excelente. Aprendi 80% disso da forma mais difícil, e os outros 20% serão uma leitura valiosa

    • tive sucesso com LangGraph e schemas do pydantic. Tenho curiosidade sobre o que outras pessoas consideram útil
  • Mais uma coisa: é preciso planejar o custo ao escalar

    • como o custo ao escalar pode ficar alto, vale tentar primeiro tudo o que puder ser tratado com componentes determinísticos. Isso pode reduzir alucinações e latência, além de fazer grande diferença na economia de custos
  • Para ficar mais fácil seguir os princípios, é preciso uma narrativa consistente. Usar exemplos do mundo real seria bom

  • Muito feliz por isso ter chegado à primeira página do HN

  • Muito legal ver BAML aqui. Concordo 100% com tratar LLM como função