Software depois da IA: o início da era do harness
(tomtunguz.com)- O fim da era do software é o início da era do harness, e o SaaS que operava com fluxos de trabalho fixos e bancos de dados gerenciados está sendo substituído por IA com inteligência
- A IA é poderosa, mas, como um cavalo selvagem, ainda não foi domada; para aproveitar sua força, é necessário um processo de controle sistemático (domestication)
- O harness de agentes de IA é definido por 7 componentes centrais ao redor de um LLM no centro, e cada elemento determina a confiabilidade e o desempenho em nível de produção
- Em uma era em que todas as empresas têm acesso aos mesmos modelos, o vencedor não é o modelo em si, mas quem projeta e opera melhor o harness (best rider)
- Milhares de mercados separados que os grandes labs não priorizam continuam sendo oportunidade para startups
O significado da era do harness
- A IA está substituindo por inteligência (intelligence) o SaaS baseado em fluxos de trabalho fixos e os bancos de dados gerenciados, redefinindo o paradigma de software
- A IA é comparada a um mustang: poderosa, porém bruta, e não pode ser usada como está; o processo de domá-la é justamente o harness
- A essência dessa domesticação é uma arquitetura com o LLM no centro e 7 componentes dispostos radialmente ao seu redor
Os 7 componentes do harness de agentes de IA
-
1. Context & Memory (contexto e memória)
- Modelos de uso geral exigem retrieval sob medida para cada caso (bespoke retrieval); um sistema de busca de contexto para radiologistas não pode ser igual ao de assistentes jurídicos
- Memória de curto prazo ("o que o agente estava fazendo há 45 segundos"), busca de imagens em larga escala (radiologia/geração de imagem), busca por palavras-chave em bilhões de documentos etc. exigem sistemas diferentes conforme o caso
- Ao lado da busca fica o banco de dados de contexto, que funciona como um "livro de receitas" de como o negócio realmente opera
- Os procedimentos operacionais padrão (SOP) que as pessoas carregam na cabeça ao chegar ao trabalho são justamente essa receita
- A captura inicial e a evolução conforme pessoas e processos mudam são a essência do banco de dados de contexto
-
2. Tools & Action (ferramentas e ação)
- Ferramentas são o meio pelo qual o agente afeta o mundo externo; se a receita do banco de contexto define o que fazer, as ferramentas são os materiais e instrumentos que executam isso de fato
- O harness moderno expõe ferramentas por meio de um registry, valida os argumentos enviados pelo modelo, despacha chamadas, faz operações sensíveis passarem por gates de aprovação e processa os resultados de volta no loop do agente
- MCP está emergindo como o tecido conjuntivo (connective tissue) para conectar ferramentas
- A qualidade do harness é determinada pela quantidade de ferramentas que ele consegue expor com segurança e pela capacidade de tratar falhas de forma limpa
-
3. Orchestration & Loop (orquestração e loop)
- O loop do agente tem a estrutura think → act → observe → repeat
- Planejamento, decomposição de tarefas, subagentes, retries e condições de interrupção definem como o trabalho é executado
- O sistema deve melhorar com o uso, e o padrão de closed loop que aprende com cada execução é um fator de diferenciação entre fornecedores
-
4. State & Persistence (estado e persistência)
- Em grandes empresas, onde muitas pessoas usam o sistema ao mesmo tempo, resiliência (resilient) é essencial
- Se o harness falhar na etapa 7 de um processo de 10 etapas, ele deve retomar da etapa 8, e não recomeçar do zero
- Sistema de arquivos, checkpoints, threads de sessão e armazenamento de artefatos são mecanismos para evitar perda de trabalho
-
5. Sandbox & Compute (sandbox e computação)
- Cada agente precisa de um espaço de trabalho isolado (sandbox)
- Workspaces Unix isolados, egress de rede controlado e credenciais armazenadas fora do modelo garantem segurança, confidencialidade e velocidade em escala
-
6. Observability & Governance (observabilidade e governança)
- "O que não pode ser visto não pode ser confiado" — rastrear todas as etapas, registrar todas as chamadas de ferramentas, executar evals como testes de regressão e incluir human-in-the-loop nas decisões de maior risco é o que transforma uma demo em sistema de produção
- Guardrails impõem políticas, e Evals detectam regressões antes dos clientes
-
7. Cost & Workflow Optimization (custo e otimização de workflow)
- O sétimo componente é o julgamento arquitetural (architectural judgment)
- É preciso decidir o que deve ser tratado de forma determinística vs. não determinística, escolher o modelo adequado para cada etapa (de ponta, médio, pequeno, fine-tuned) e definir se o conhecimento deve ficar em skills ou em memória
Nova dinâmica competitiva
- O resultado é uma nova dinâmica competitiva do software, que não se aplica da mesma forma a todas as categorias
- Mercados priorizados pelos grandes labs (principais laboratórios de IA) se beneficiam de execução rápida e controle direto sobre o modelo
- Mas, fora disso, milhares de mercados distintos permanecem abertos para startups
- Em uma era em que todas as empresas podem usar os mesmos modelos, "os melhores cavaleiros (best riders)" vencem — ou seja, a capacidade de projetar e operar o harness é a principal vantagem competitiva
Ainda não há comentários.