- Ferramenta de monitoramento baseada em IA com foco na automação da resposta a incidentes em ambientes Kubernetes
- Utiliza o Claude Code para analisar em tempo real o estado dos Pods, detectar erros e corrigir automaticamente ou gerar relatórios
- Executado periodicamente no formato de CronJob, mantendo um sistema autônomo de resposta 24 horas mesmo quando não há operadores disponíveis
- Principais funções
- Monitoramento do estado dos Pods no Namespace de destino
- Detecção de estados anormais como CrashLoopBackOff, Error etc.
- Identificação da causa do erro por meio da análise de logs
- Quando necessário, entrada no interior do Pod para aplicar hotfixes
- Registro das alterações em um banco SQLite e fornecimento de relatórios
- Suporte à visualização de erros e histórico de correções em uma interface web por meio de uma configuração separada de implantação do Dashboard
- Estrutura leve composta por Go + HTML + Shell, otimizada para implantação como Kubernetes CronJob
- Licença MIT
1 comentários
Eu estava pensando que seria bom se existisse algo parecido, e isso parece bem interessante. Usando no modo watcher, acho que dá para testar com segurança primeiro.