- Engenharia de software responde por cerca de 50% de todas as chamadas de ferramentas de agentes de IA, enquanto 16 verticais como saúde, jurídico e finanças ficam cada um abaixo de 5%
- A capacidade real dos modelos de IA já alcança o nível de executar tarefas que levariam 5 horas para um humano, mas nas aplicações reais a sessão no percentil 99,9 dura apenas cerca de 42 minutos, revelando uma grande lacuna entre capacidade e confiança
- À medida que a experiência do usuário se acumula, a taxa de aprovação automática sobe de 20% para mais de 40%, e ao mesmo tempo usuários experientes mudam sua estratégia de supervisão de aprovação prévia para monitoramento ativo
- O núcleo da IA vertical está em integração com dados proprietários, engenharia de contexto especializada no domínio e gestão de mudança no cliente, o que distingue wrappers simples de empresas defensáveis
- Assim como o SaaS gerou mais de 170 unicórnios nas últimas décadas, pode surgir um unicórnio de IA vertical correspondente para cada unicórnio SaaS, e a versão com IA pode substituir não só o software, mas também os operadores
Engenharia de software ocupa metade da atividade de agentes de IA
- Segundo um estudo da Anthropic sobre o uso real de agentes de IA, engenharia de software representa 49,7% das chamadas de ferramentas agenticas
- Saúde fica em 1%, jurídico em 0,9% e educação em apenas 1,8%, e entre 16 verticais nenhum setor ultrapassa 9%
- Isso não significa que o mercado esteja saturado, mas sim que ainda não foi formado
- Han Wang descreve isso como uma oportunidade greenfield que a maioria dos fundadores ignora
- O autor deste texto, Garry Tan, comenta que “se eu fosse fundar uma startup agora, observaria atentamente a área vermelha deste gráfico”
Deployment Overhang
- Segundo a avaliação do METR, os modelos Claude conseguem executar tarefas que levariam 5 horas para um humano, mas as sessões reais duram em média apenas 42 minutos
- A lacuna entre o que a IA pode fazer e o que os usuários permitem cria uma grande oportunidade
- Entre outubro de 2025 e janeiro de 2026, a duração dos turnos no percentil 99,9 quase dobrou, passando de menos de 25 minutos para mais de 45 minutos
- Isso reflete não apenas a melhora do desempenho do modelo, mas também o fato de os usuários acumularem confiança a cada sessão
- Em dados internos, a taxa de sucesso do Claude Code dobrou, enquanto a intervenção humana por sessão caiu de 5,4 para 3,3 vezes
- A capacidade do modelo é suficiente, mas a implantação não acompanha, e isso representa uma nova oportunidade de produto
Como a confiança evolui
- Usuários novos aprovam automaticamente apenas 20% das sessões do Claude Code, mas depois de 750 sessões de experiência, mais de 40% passam para aprovação totalmente automática
- Contraintuitivamente, usuários experientes não intervêm menos, e sim mais — taxa de intervenção de 5% entre novatos contra 9% entre experientes
- Isso não é uma contradição, mas uma mudança na estratégia de supervisão (oversight): iniciantes fazem aprovação prévia em cada etapa; experientes delegam e intervêm quando surge um problema (aprovação prévia → monitoramento ativo)
- Descoberta relacionada à segurança: em tarefas complexas, o Claude Code faz perguntas de confirmação mais de duas vezes mais frequentemente do que humanos intervêm
- Um padrão em que o agente não avança cegamente, mas para por conta própria quando há incerteza
- Principal lição da Anthropic: a autonomia que um agente realmente exerce é co-construída por modelo, usuário e produto
O playbook de IA vertical de Aaron Levie
- Fórmula proposta por Aaron Levie para construir IA vertical:
- Entender as barreiras específicas de dados, workflow e regulação de cada indústria é a base de empresas altamente defensáveis
- Não basta ser um wrapper simples; é preciso capacidade de integração de dados exclusivos, automação de workflows e gestão de mudança
- Construir software agêntico conectado a dados proprietários
- Projetar o software para funcionar de acordo com pessoas e problemas reais
- Maximizar a inteligência de saída com engenharia de contexto especializada no domínio
- O ponto que a maioria dos fundadores ignora: conduzir a gestão de mudança (change management) para o cliente
- A IA vertical é defensável porque qualquer um pode criar um wrapper, mas poucos conseguem navegar por workflows concretos, restrições regulatórias e atritos organizacionais como faturamento em saúde, discovery jurídico ou licenciamento de obras
- O SaaS cresceu 10x a cada década ao longo de várias décadas; nos últimos 20 anos, mais de 40% do capital de VC foi concentrado em SaaS, gerando mais de 170 unicórnios SaaS
- Tese central: para cada unicórnio SaaS, haverá um unicórnio de IA vertical correspondente, e a versão com IA pode ser 10x maior porque substitui não só o software, mas também os operadores
Insight de co-construção e implicações para políticas
- Descobertas centrais da Anthropic:
- Autonomia não é uma propriedade inerente do modelo, mas algo co-construído por modelo, usuário e produto
- Avaliações pré-implantação, por si só, não capturam isso; por isso, medição em ambiente real é essencial
- Números de segurança: 73% das chamadas de ferramenta têm intervenção humana, e apenas 0,8% são classificadas como ações irreversíveis
- As implantações mais arriscadas (vazamento de chaves de API, trading autônomo de cripto etc.) são, em sua maioria, avaliações de segurança, não ambientes reais de produção
- A política de “aprovar todas as ações” prejudica apenas a produtividade, sem melhorar a segurança; um objetivo melhor de política é garantir que humanos possam monitorar e intervir
Onde os unicórnios estão escondidos
- Engenharia de software já está bastante ocupada, enquanto saúde, jurídico, finanças, educação, atendimento ao cliente e logística, entre outros,
16 verticais com participação de mercado de um dígito aguardam alguém que incorpore expertise de domínio aos agentes
- Antes surgiram 300 unicórnios SaaS; em seguida virão 300 unicórnios de IA vertical
- Os fundadores que escolherem um vertical, incorporarem expertise de domínio aos agentes e resolverem a gestão de mudança vão dominar o software empresarial da próxima década
- Os modelos já conseguem trabalhar por 5 horas, mas os usuários permitem apenas 42 minutos
- Isso mostra que ainda estamos nos estágios iniciais da adoção de IA
- E sugere que há muitos campos em que nem um único minuto de inteligência foi aplicado
Ainda não há comentários.