5 pontos por GN⁺ 2 시간 전 | Ainda não há comentários. | Compartilhar no WhatsApp
  • O fim da era do software é o início da era do harness, e o SaaS que operava com fluxos de trabalho fixos e bancos de dados gerenciados está sendo substituído por IA com inteligência
  • A IA é poderosa, mas, como um cavalo selvagem, ainda não foi domada; para aproveitar sua força, é necessário um processo de controle sistemático (domestication)
  • O harness de agentes de IA é definido por 7 componentes centrais ao redor de um LLM no centro, e cada elemento determina a confiabilidade e o desempenho em nível de produção
  • Em uma era em que todas as empresas têm acesso aos mesmos modelos, o vencedor não é o modelo em si, mas quem projeta e opera melhor o harness (best rider)
  • Milhares de mercados separados que os grandes labs não priorizam continuam sendo oportunidade para startups

O significado da era do harness

  • A IA está substituindo por inteligência (intelligence) o SaaS baseado em fluxos de trabalho fixos e os bancos de dados gerenciados, redefinindo o paradigma de software
  • A IA é comparada a um mustang: poderosa, porém bruta, e não pode ser usada como está; o processo de domá-la é justamente o harness
  • A essência dessa domesticação é uma arquitetura com o LLM no centro e 7 componentes dispostos radialmente ao seu redor

Os 7 componentes do harness de agentes de IA

  • 1. Context & Memory (contexto e memória)

    • Modelos de uso geral exigem retrieval sob medida para cada caso (bespoke retrieval); um sistema de busca de contexto para radiologistas não pode ser igual ao de assistentes jurídicos
    • Memória de curto prazo ("o que o agente estava fazendo há 45 segundos"), busca de imagens em larga escala (radiologia/geração de imagem), busca por palavras-chave em bilhões de documentos etc. exigem sistemas diferentes conforme o caso
    • Ao lado da busca fica o banco de dados de contexto, que funciona como um "livro de receitas" de como o negócio realmente opera
      • Os procedimentos operacionais padrão (SOP) que as pessoas carregam na cabeça ao chegar ao trabalho são justamente essa receita
      • A captura inicial e a evolução conforme pessoas e processos mudam são a essência do banco de dados de contexto
  • 2. Tools & Action (ferramentas e ação)

    • Ferramentas são o meio pelo qual o agente afeta o mundo externo; se a receita do banco de contexto define o que fazer, as ferramentas são os materiais e instrumentos que executam isso de fato
    • O harness moderno expõe ferramentas por meio de um registry, valida os argumentos enviados pelo modelo, despacha chamadas, faz operações sensíveis passarem por gates de aprovação e processa os resultados de volta no loop do agente
    • MCP está emergindo como o tecido conjuntivo (connective tissue) para conectar ferramentas
    • A qualidade do harness é determinada pela quantidade de ferramentas que ele consegue expor com segurança e pela capacidade de tratar falhas de forma limpa
  • 3. Orchestration & Loop (orquestração e loop)

    • O loop do agente tem a estrutura think → act → observe → repeat
    • Planejamento, decomposição de tarefas, subagentes, retries e condições de interrupção definem como o trabalho é executado
    • O sistema deve melhorar com o uso, e o padrão de closed loop que aprende com cada execução é um fator de diferenciação entre fornecedores
  • 4. State & Persistence (estado e persistência)

    • Em grandes empresas, onde muitas pessoas usam o sistema ao mesmo tempo, resiliência (resilient) é essencial
    • Se o harness falhar na etapa 7 de um processo de 10 etapas, ele deve retomar da etapa 8, e não recomeçar do zero
    • Sistema de arquivos, checkpoints, threads de sessão e armazenamento de artefatos são mecanismos para evitar perda de trabalho
  • 5. Sandbox & Compute (sandbox e computação)

    • Cada agente precisa de um espaço de trabalho isolado (sandbox)
    • Workspaces Unix isolados, egress de rede controlado e credenciais armazenadas fora do modelo garantem segurança, confidencialidade e velocidade em escala
  • 6. Observability & Governance (observabilidade e governança)

    • "O que não pode ser visto não pode ser confiado" — rastrear todas as etapas, registrar todas as chamadas de ferramentas, executar evals como testes de regressão e incluir human-in-the-loop nas decisões de maior risco é o que transforma uma demo em sistema de produção
    • Guardrails impõem políticas, e Evals detectam regressões antes dos clientes
  • 7. Cost & Workflow Optimization (custo e otimização de workflow)

    • O sétimo componente é o julgamento arquitetural (architectural judgment)
    • É preciso decidir o que deve ser tratado de forma determinística vs. não determinística, escolher o modelo adequado para cada etapa (de ponta, médio, pequeno, fine-tuned) e definir se o conhecimento deve ficar em skills ou em memória

Nova dinâmica competitiva

  • O resultado é uma nova dinâmica competitiva do software, que não se aplica da mesma forma a todas as categorias
  • Mercados priorizados pelos grandes labs (principais laboratórios de IA) se beneficiam de execução rápida e controle direto sobre o modelo
  • Mas, fora disso, milhares de mercados distintos permanecem abertos para startups
  • Em uma era em que todas as empresas podem usar os mesmos modelos, "os melhores cavaleiros (best riders)" vencem — ou seja, a capacidade de projetar e operar o harness é a principal vantagem competitiva

Ainda não há comentários.

Ainda não há comentários.