1 pontos por GN⁺ 2023-07-31 | 1 comentários | Compartilhar no WhatsApp
  • Contas de usuários desapareceram na instância Mastodon do Vivaldi Social
  • Os administradores de sistema começaram a investigar o problema
  • As contas afetadas foram apagadas e recriadas quando os usuários faziam login novamente
  • Backups do banco de dados foram usados para recuperar a perda de dados
  • Foi identificado um padrão incomum nas exclusões
  • Os desenvolvedores do Mastodon foram contatados para pedir ajuda
  • As contas continuaram sendo excluídas até que a instância Docker fosse reiniciada
  • Um possível ataque ou bug de software foi identificado como causa
  • A configuração de replicação do banco de dados foi identificada como um fator principal
  • Foi desenvolvida uma teoria de que a ordem de mesclagem de contas causava o problema
  • Um patch foi fornecido para evitar ocorrências futuras
  • O trabalho de recuperação incluiu restauração seletiva e mudanças de configuração
  • Houve dificuldades técnicas durante o processo de restauração
  • O problema foi resolvido, e o Vivaldi Social voltou a operar normalmente
  • Um bug no código e um problema na configuração do banco de dados fizeram com que 198 contas de usuários fossem mescladas em uma só
  • A resolução do problema levou o fim de semana inteiro
  • A equipe de desenvolvimento do Mastodon ofereceu um suporte excepcional
  • Após a restauração, problemas de login e contadores de perfil incorretos foram corrigidos
  • A experiência foi encerrada com satisfação e gratidão a todos os envolvidos
  • Isso também serviu como um momento para agradecer aos administradores de sistema e lembrar o Dia de Agradecimento aos Administradores de Sistema

1 comentários

 
GN⁺ 2023-07-31
Comentário do Hacker News
  • Discute o incidente relacionado ao Vivaldi Social e os problemas que eles enfrentaram.
  • O uso de valores NULL no banco de dados é destacado como uma causa potencial de bugs e complexidade.
  • O processo de backup e restauração é descrito como desafiador e propenso a erros.
  • A equipe de desenvolvimento do Mastodon é elogiada pelo suporte durante o incidente.
  • A falta de atomicidade em determinadas operações é mencionada como um problema potencial.
  • A análise pós-incidente é elogiada por ser bem escrita e informativa.
  • É mencionado o uso de ferramentas como split(1) para dividir grandes dumps SQL.
  • A capacidade de extrair rastreamentos de pilha completos dos logs é vista como impressionante.
  • É levantada a questão de como contas com valores NULL no campo URI correspondiam à consulta.
  • Um erro no script de recuperação causou problemas para usuários com símbolos no nome de usuário.