- Nas últimas décadas, o objetivo central das ferramentas de Observability era tornar compreensíveis para humanos grandes volumes de dados heterogêneos de Telemetry
- Com o surgimento da IA e dos LLMs, o paradigma tradicional centrado em "dashboards + alertas + amostragem" está mudando, e o processo de análise vem sendo substituído por automação
- Na prática, um agente de IA analisou a causa de um pico de latência em 80 segundos com 8 chamadas de ferramenta, automatizando tarefas que antes eram feitas em demos e resolvendo tudo por apenas 60 centavos
- Dashboards bonitos ou instrumentação conveniente já não têm mais um valor tão especial, e LLMs comoditizam a análise, enquanto o OpenTelemetry comoditiza a instrumentação
- O futuro da Observability está em "loops rápidos de feedback" e em fluxos de trabalho colaborativos entre IA e humanos, que serão a chave do sucesso e conduzirão uma era com mais software e automação
A história das ferramentas de Observability e a chegada da IA
- Durante décadas, o principal objetivo das ferramentas de observabilidade foi comprimir/resumir grandes volumes de dados heterogêneos (telemetria) até um nível compreensível para humanos
- Sempre que surgiam novas abstrações de software (como Rails, AWS, Kubernetes, OpenTelemetry etc.),
também foram sendo desenvolvidas várias ferramentas — monitoramento, medição, dashboards, alertas adaptativos, amostragem dinâmica e outras — para ocultar essa complexidade e entregar os dados comprimidos de forma compatível com a cognição humana
LLM = aproximador universal de funções, e agora realmente útil
- Matematicamente, LLMs são apenas aproximadores universais de funções (universal function approximator), mas na prática são muito úteis para resolver problemas de observabilidade
- Exemplo: em uma demo da Honeycomb, foi pedido em linguagem natural a um agente de IA para analisar um pico de latência em um heatmap
- “Analise a causa dos picos de latência que ocorrem a cada 4 horas no serviço de frontend”
- Integração entre um LLM pronto para uso (Claude Sonnet 4) e o Model Context Protocol (MCP) da Honeycomb
- Análise automática da causa em 80 segundos, com 8 chamadas de ferramenta e custo de 60 centavos
- Chegou-se a um nível em que cenários reais são resolvidos em zero-shot, sem prompts adicionais, treinamento separado ou guias
- Comoditização da análise:
- Se LLMs automatizam o trabalho de análise, os diferenciais dos produtos tradicionais de observabilidade (gráficos bonitos, instrumentação fácil etc.) perdem relevância
- O OpenTelemetry comoditiza a instrumentação, e os LLMs comoditizam a análise
- Daqui para frente, “loops rápidos de feedback” substituem o valor central das ferramentas de observabilidade
O papel das pessoas e as mudanças futuras
- O papel humano não desaparece completamente
- Assim como o surgimento da nuvem não eliminou a própria existência da TI, a IA também não substituirá desenvolvedores e operadores
- O aumento de produtividade expande todo o cenário e faz nascer ainda mais software
- A pergunta central é:
em um mundo em que o custo de escrever código/refatorar/analisar cai drasticamente,
e a análise se torna uma constante, para onde vai a essência da Observability?
O que realmente importa é o "feedback rápido"
- O mais importante é ter "loops de feedback rápidos e densos" em todas as etapas de desenvolvimento e operação
- A IA sempre superará os humanos em velocidade
- LLMs levantam dezenas de hipóteses rapidamente, falham e acabam encontrando o resultado correto
(e com custo muito baixo)
- A filosofia da Honeycomb:
- loops rápidos de feedback, compartilhamento colaborativo de conhecimento e desenvolvimento/operação experimental
- Daqui em diante, assistentes de IA serão introduzidos em todo o ciclo de vida do desenvolvimento e da operação de software
- Exemplos
- Durante a escrita e o deploy de código, agentes de IA fornecem feedback em tempo real e sugerem melhorias de bugs e qualidade
- Em produção, detectam/analisam/emitem relatórios automáticos sobre comportamento emergente e, após aprovação, aplicam melhorias automaticamente
- Organizações de ponta automatizam papéis de SRE/SWE com IA + ferramentas, chegando a cumprir diretamente até metas de negócio
- Condições futuras da observabilidade para o sucesso
- Desempenho de consulta com latência ultrabaixa
- Repositório unificado de dados
- Fluxos de trabalho fluidos de colaboração entre humanos e IA
- Conclusão:
- Ferramentas tradicionais de observabilidade focadas em dashboards, alertas e visualização
não serão o centro na era da IA;
apenas os “loops rápidos de feedback” e as plataformas de colaboração entre IA e humanos sobreviverão
4 comentários
Assim como a observabilidade não significou o fim do monitoramento, os LLMs provavelmente também não significarão o fim da observabilidade
Assim como a observabilidade evoluiu sobre uma base de monitoramento avançado, a análise com LLMs deverá evoluir sobre uma base de observabilidade avançada
Estou animado achando que a área de Observability vai se inovar rapidamente por causa dos LLMs, mas o título é caça-clique demais kkk
Fazer marketing do próprio serviço dizendo que “o fim está chegando” é um pouco constrangedor...
Pessoalmente, estou esperando que os vision LLM evoluam para serem usados em tarefas de monitoramento. Recentemente vi o post de um pai que usou um VLM para verificar enquanto a criança dormia se não havia nada fora do normal, e achei isso bem interessante.
Opiniões no Hacker News