Olá. Enquanto trabalho em uma empresa, estou criando ferramentas de desenvolvimento como projeto paralelo. Quero compartilhar o Relivio, que organiza a tomada de decisão nos 15 minutos logo após um deploy.
O que sempre me incomodou em deploy não era o deploy em si, mas os 15 minutos logo depois. O CI passou e os dashboards parecem, em geral, normais, mas quando os erros aumentam um pouco, não fica claro na hora se isso foi causado por este deploy, se é apenas uma oscilação que já acontecia de vez em quando, ou se é preciso fazer rollback agora.
O Relivio não é uma ferramenta para substituir o monitoramento existente. O monitoramento é forte para observar amplamente o estado geral do sistema no dia a dia, enquanto o Relivio é uma camada estreita focada em responder apenas uma pergunta: “este deploy está ok agora?”.
O que ele faz é simples. Ele recebe logs de erro já existentes, stack traces, tipos de exceção e informações de deploy, e produz um único verdict por unidade de deploy.
- Julgamento em três níveis: STABLE / WATCH / RISK
- Lista de APIs afetadas
- Uma linha com a próxima ação (next action)
Defini com firmeza um princípio: não recebo nenhum dado que quem usa a ferramenta precise medir e enviar de forma nova. Sem esse limite, no fim isso acabaria indo na direção de recriar um pequeno APM.
As pessoas veem o verdict pelo console ou por alertas no Slack / Discord, e os agentes leem o mesmo verdict via API ou servidor MCP. A estrutura foi pensada para que o registro da decisão tomada logo após o deploy possa ser lido depois por outros agentes ou por mim mesmo no futuro.
- Teste agora mesmo (sem cadastro): relivio.dev/demo
- Source / repositório do app de demonstração: github.com/lazypl82/relivio-demo-fastapi
- SDK TypeScript: npm relivio
- SDK Python: PyPI relivio
- Inclui servidor MCP
- Apresentação do produto: relivio.dev
Ainda está em alpha e eu ainda não consegui meus primeiros usuários. Gostaria especialmente de saber os seguintes pontos.
- Vocês sentem que realmente é necessária uma camada separada para lidar com os 15 minutos após o deploy, ou a stack existente já é suficiente?
- A divisão em três níveis STABLE / WATCH / RISK parece útil na prática? (
WATCHé o ponto sobre o qual tenho menos confiança.) - Uma estrutura em que agentes leem o verdict via MCP teria utilidade?
Ainda não há comentários.