Post-mortem da falha do evento com 100% de desconto de janeiro de 2022
(tech.inflab.com)Este é um texto de post-mortem sobre a falha ocorrida no serviço da Inflearn, que entre 3 e 17 de janeiro de 2022 impediu continuamente o uso do serviço. O texto aborda em detalhes todo o processo, desde a descoberta da falha, a resposta inicial, a recorrência, a análise da causa raiz e a resolução definitiva da causa raiz.
5 comentários
Obrigado pelo ótimo texto. Mas existe uma palavra boa, “retrospectiva”... então por que vocês usaram a palavra “autópsia”? Não está errado, mas soa um pouco negativo.
Pela tradução de Postmortem, parece que usam bastante a palavra "autópsia" para se referir às medidas tomadas após a ocorrência de um incidente.
Eu achei engraçado porque entendi como uma nuance de fazer uma autópsia, já que o serviço morreu (...). Mas dá para sentir de outra forma também. "m "
Acho que a nuance é algo como o e-mail de postmortem da Netflix.
Em especial, a parte de análise da causa raiz que permite sentir na prática o impacto que os Dead Tuples do PostgreSQL podem ter no serviço parece ser uma boa referência.