O gato que avisou sobre um ataque DDoS
- Quando o autor trabalhava em uma startup, não havia uma rotação formal de on-call
- Como on-call é algo desgastante, isso foi evitado de propósito
- Em vez disso, os membros da equipe tentavam ficar atentos juntos aos alertas de emergência
- Certo dia, por volta das 3 da manhã, o autor acordou porque seu gato começou a lamber sua cabeça
- O hábito de se limpar do gato em si não era algo incomum, mas foi a primeira vez em 9 anos que ele fez isso enquanto o autor dormia
- Ao verificar o celular, ele viu que um alerta do AWS CloudWatch havia sido disparado alguns minutos antes
- Era um alerta sobre alvos não íntegros no load balancer
- Como o site da empresa não carregava, ele abriu o dashboard de monitoramento
- Havia um grande volume de requisições vindo de muitos endereços IP, principalmente de IPs no exterior
- Como o produto da empresa só podia ser usado dentro dos Estados Unidos, tráfego internacional não era algo normal
- Ele percebeu que se tratava de um ataque de negação de serviço distribuída (DDoS)
- No início, tentou bloquear os endereços IP no nível do servidor, mas então se lembrou de que o AWS WAF (Web Application Firewall) já estava configurado
- Para lidar com a indisponibilidade imediata, ele criou uma regra para bloquear requisições vindas de outros países
- Essa medida bloqueou centenas de milhares de requisições, e o site voltou a funcionar
- Mais tarde, ele descobriu que havia chegado uma mensagem no e-mail de suporte ao cliente no momento em que o ataque começou
- O remetente, com uma gramática horrível, afirmava ter encontrado uma vulnerabilidade no site capaz de derrubar um Apache que nem sequer era usado
- Dizia que forneceria um "arquivo da solução" se recebesse US$ 5.000 em bitcoin, mas ele decidiu não responder
- O autor ainda acha difícil acreditar no timing perfeito com que o gato o acordou
- Dá para supor que o celular tenha vibrado ou emitido algum som por causa do alerta da AWS e que isso tenha acordado o gato primeiro, mas o modo não perturbe estava ativado durante a noite
- Por isso, ele prefere acreditar que o gato de alguma forma percebeu que havia um problema que não podia esperar até a manhã
- Foi uma forma muito mais agradável de ser acordado do que por um alerta do PagerDuty
Opinião do GN⁺
- É verdade que, no começo de uma startup, pode ser difícil ter uma rotação formal de on-call, mas pelo menos vale a pena ter um sistema básico de monitoramento e alertas. Manter toda a equipe de prontidão o tempo todo não é sustentável
- Parece que ter o AWS WAF e afins configurados com antecedência facilitou a reação na hora da emergência. É um caso que mostra a importância de medidas preventivas contra ameaças de segurança
- Foi uma decisão sensata não responder ao e-mail do atacante. Ceder a ameaças pode causar problemas ainda maiores
- Se fosse adotado um sistema de detecção de anomalias baseado em machine learning, um algoritmo poderia identificar esse tipo de ataque cedo em vez do gato. Ainda assim, talvez não seja bom subestimar o instinto dos animais de estimação
1 comentários
Comentários do Hacker News