Quão autonomamente os agentes de IA estão realmente trabalhando
- A Anthropic analisou milhões de interações no Claude Code para medir quanto trabalho os agentes de IA estão realmente assumindo.
- O ponto central da pesquisa não foi o desempenho do modelo, mas quanto de autonomia os humanos delegaram.
- A maioria das tarefas é curta, mas o maior tempo de trabalho autônomo aumentou de 25 minutos para mais de 45 minutos ao longo de 3 meses.
- O ponto interessante é que essa mudança veio do acúmulo de confiança dos usuários, e não de upgrades do modelo.
- Usuários mais experientes mudam sua estratégia de supervisão para um “modo de monitoramento”, elevando a taxa de aprovações automáticas e intervindo no meio do processo quando necessário.
- Além disso, a própria IA também demonstra mecanismos de autocontrole, fazendo perguntas ou parando quando há incerteza.
- Atualmente, metade do uso de agentes está concentrada na área de desenvolvimento de software.
- No fim, a autonomia dos agentes de IA é determinada menos pelo desempenho do modelo e mais por confiança, cultura organizacional e estrutura de ferramentas.
1 comentários
Espera!<ctrl+ enter>