25 pontos por tenshi 2022-02-03 | 5 comentários | Compartilhar no WhatsApp

Este é um texto de post-mortem sobre a falha ocorrida no serviço da Inflearn, que entre 3 e 17 de janeiro de 2022 impediu continuamente o uso do serviço. O texto aborda em detalhes todo o processo, desde a descoberta da falha, a resposta inicial, a recorrência, a análise da causa raiz e a resolução definitiva da causa raiz.

5 comentários

 
xor100 2022-02-03

Obrigado pelo ótimo texto. Mas existe uma palavra boa, “retrospectiva”... então por que vocês usaram a palavra “autópsia”? Não está errado, mas soa um pouco negativo.

 
kbumsik 2022-02-04

Pela tradução de Postmortem, parece que usam bastante a palavra "autópsia" para se referir às medidas tomadas após a ocorrência de um incidente.

 
ffdd270 2022-02-04

Eu achei engraçado porque entendi como uma nuance de fazer uma autópsia, já que o serviço morreu (...). Mas dá para sentir de outra forma também. "m "

 
budlebee 2022-02-03

Acho que a nuance é algo como o e-mail de postmortem da Netflix.

 
tenshi 2022-02-03

Especialmente no caso da tabela de cursos, devido às colunas de grande volume (o código HTML da coluna de apresentação do curso), o tamanho de cada Dead Tuple é bastante alto.

Por isso, consultas de atualização frequentes acabam levando à produção em massa de Dead Tuples de grande volume.

Em especial, a parte de análise da causa raiz que permite sentir na prática o impacto que os Dead Tuples do PostgreSQL podem ter no serviço parece ser uma boa referência.