18 pontos por GN⁺ 2026-02-23 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Engenharia de software responde por cerca de 50% de todas as chamadas de ferramentas de agentes de IA, enquanto 16 verticais como saúde, jurídico e finanças ficam cada um abaixo de 5%
  • A capacidade real dos modelos de IA já alcança o nível de executar tarefas que levariam 5 horas para um humano, mas nas aplicações reais a sessão no percentil 99,9 dura apenas cerca de 42 minutos, revelando uma grande lacuna entre capacidade e confiança
  • À medida que a experiência do usuário se acumula, a taxa de aprovação automática sobe de 20% para mais de 40%, e ao mesmo tempo usuários experientes mudam sua estratégia de supervisão de aprovação prévia para monitoramento ativo
  • O núcleo da IA vertical está em integração com dados proprietários, engenharia de contexto especializada no domínio e gestão de mudança no cliente, o que distingue wrappers simples de empresas defensáveis
  • Assim como o SaaS gerou mais de 170 unicórnios nas últimas décadas, pode surgir um unicórnio de IA vertical correspondente para cada unicórnio SaaS, e a versão com IA pode substituir não só o software, mas também os operadores

Engenharia de software ocupa metade da atividade de agentes de IA

  • Segundo um estudo da Anthropic sobre o uso real de agentes de IA, engenharia de software representa 49,7% das chamadas de ferramentas agenticas
  • Saúde fica em 1%, jurídico em 0,9% e educação em apenas 1,8%, e entre 16 verticais nenhum setor ultrapassa 9%
  • Isso não significa que o mercado esteja saturado, mas sim que ainda não foi formado
  • Han Wang descreve isso como uma oportunidade greenfield que a maioria dos fundadores ignora
  • O autor deste texto, Garry Tan, comenta que “se eu fosse fundar uma startup agora, observaria atentamente a área vermelha deste gráfico

Deployment Overhang

  • Segundo a avaliação do METR, os modelos Claude conseguem executar tarefas que levariam 5 horas para um humano, mas as sessões reais duram em média apenas 42 minutos
  • A lacuna entre o que a IA pode fazer e o que os usuários permitem cria uma grande oportunidade
  • Entre outubro de 2025 e janeiro de 2026, a duração dos turnos no percentil 99,9 quase dobrou, passando de menos de 25 minutos para mais de 45 minutos
    • Isso reflete não apenas a melhora do desempenho do modelo, mas também o fato de os usuários acumularem confiança a cada sessão
  • Em dados internos, a taxa de sucesso do Claude Code dobrou, enquanto a intervenção humana por sessão caiu de 5,4 para 3,3 vezes
  • A capacidade do modelo é suficiente, mas a implantação não acompanha, e isso representa uma nova oportunidade de produto

Como a confiança evolui

  • Usuários novos aprovam automaticamente apenas 20% das sessões do Claude Code, mas depois de 750 sessões de experiência, mais de 40% passam para aprovação totalmente automática
  • Contraintuitivamente, usuários experientes não intervêm menos, e sim mais — taxa de intervenção de 5% entre novatos contra 9% entre experientes
    • Isso não é uma contradição, mas uma mudança na estratégia de supervisão (oversight): iniciantes fazem aprovação prévia em cada etapa; experientes delegam e intervêm quando surge um problema (aprovação prévia → monitoramento ativo)
  • Descoberta relacionada à segurança: em tarefas complexas, o Claude Code faz perguntas de confirmação mais de duas vezes mais frequentemente do que humanos intervêm
    • Um padrão em que o agente não avança cegamente, mas para por conta própria quando há incerteza
  • Principal lição da Anthropic: a autonomia que um agente realmente exerce é co-construída por modelo, usuário e produto

O playbook de IA vertical de Aaron Levie

  • Fórmula proposta por Aaron Levie para construir IA vertical:
    • Entender as barreiras específicas de dados, workflow e regulação de cada indústria é a base de empresas altamente defensáveis
    • Não basta ser um wrapper simples; é preciso capacidade de integração de dados exclusivos, automação de workflows e gestão de mudança
    • Construir software agêntico conectado a dados proprietários
    • Projetar o software para funcionar de acordo com pessoas e problemas reais
    • Maximizar a inteligência de saída com engenharia de contexto especializada no domínio
    • O ponto que a maioria dos fundadores ignora: conduzir a gestão de mudança (change management) para o cliente
  • A IA vertical é defensável porque qualquer um pode criar um wrapper, mas poucos conseguem navegar por workflows concretos, restrições regulatórias e atritos organizacionais como faturamento em saúde, discovery jurídico ou licenciamento de obras
  • O SaaS cresceu 10x a cada década ao longo de várias décadas; nos últimos 20 anos, mais de 40% do capital de VC foi concentrado em SaaS, gerando mais de 170 unicórnios SaaS
  • Tese central: para cada unicórnio SaaS, haverá um unicórnio de IA vertical correspondente, e a versão com IA pode ser 10x maior porque substitui não só o software, mas também os operadores

Insight de co-construção e implicações para políticas

  • Descobertas centrais da Anthropic:
    • Autonomia não é uma propriedade inerente do modelo, mas algo co-construído por modelo, usuário e produto
    • Avaliações pré-implantação, por si só, não capturam isso; por isso, medição em ambiente real é essencial
  • Números de segurança: 73% das chamadas de ferramenta têm intervenção humana, e apenas 0,8% são classificadas como ações irreversíveis
    • As implantações mais arriscadas (vazamento de chaves de API, trading autônomo de cripto etc.) são, em sua maioria, avaliações de segurança, não ambientes reais de produção
  • A política de “aprovar todas as ações” prejudica apenas a produtividade, sem melhorar a segurança; um objetivo melhor de política é garantir que humanos possam monitorar e intervir

Onde os unicórnios estão escondidos

  • Engenharia de software já está bastante ocupada, enquanto saúde, jurídico, finanças, educação, atendimento ao cliente e logística, entre outros,
    16 verticais com participação de mercado de um dígito aguardam alguém que incorpore expertise de domínio aos agentes
  • Antes surgiram 300 unicórnios SaaS; em seguida virão 300 unicórnios de IA vertical
  • Os fundadores que escolherem um vertical, incorporarem expertise de domínio aos agentes e resolverem a gestão de mudança vão dominar o software empresarial da próxima década
  • Os modelos já conseguem trabalhar por 5 horas, mas os usuários permitem apenas 42 minutos
    • Isso mostra que ainda estamos nos estágios iniciais da adoção de IA
    • E sugere que há muitos campos em que nem um único minuto de inteligência foi aplicado

Ainda não há comentários.

Ainda não há comentários.