- Um incêndio na sala de servidores do National Information Resources Service (NIRS), em Daejeon, causou a perda total dos dados da nuvem G-Drive do governo
- Cerca de 750 mil arquivos de trabalho individuais de servidores públicos foram apagados permanentemente
- A ausência de backup externo, devido à arquitetura de armazenamento de grande capacidade e baixo desempenho, foi uma vulnerabilidade fatal
- Alguns ministérios, especialmente o Ministry of Personnel Management, sofreram danos graves, e a recuperação é limitada
- Crescem as críticas ao sistema de gestão de dados e as cobranças por medidas para evitar recorrência
Visão geral do incidente de destruição do sistema de armazenamento em nuvem do governo causado pelo incêndio no NIRS
- Um incêndio ocorrido em 27 de setembro no prédio principal do National Information Resources Service (NIRS), em Daejeon, destruiu o sistema de armazenamento em nuvem G-Drive do governo
- Segundo anúncio do Ministry of the Interior and Safety, todos os arquivos de trabalho armazenados individualmente por 750 mil servidores públicos foram apagados
Danos e impacto
- O incêndio começou na sala de servidores do 5º andar do centro e causou danos críticos a 96 sistemas de informação essenciais para as operações do governo central e à plataforma G-Drive
- O G-Drive, introduzido em 2018, obrigava os servidores públicos a armazenar todos os documentos de trabalho na nuvem, e não em PCs pessoais
- A estrutura oferecia cerca de 30 GB de capacidade por pessoa
Falhas de backup e causa da perda permanente dos dados
- O sistema foi projetado sem backup externo, devido à sua arquitetura de armazenamento de grande capacidade e baixo desempenho
- Essa limitação estrutural tornou impossível a recuperação dos dados após o incêndio
Diferença de danos entre órgãos
- A dimensão dos danos variou entre os órgãos
- O Ministry of Personnel Management sofreu o maior impacto porque exigia que todos os documentos fossem armazenados no G-Drive
- Alguns órgãos, como o Office for Government Policy Coordination, sofreram danos relativamente menores
Esforços de recuperação e limitações
- Nos últimos dias, cada ministério vem conduzindo uma recuperação limitada com base em dados alternativos, como arquivos salvos em PCs pessoais, e-mails, documentos oficiais e registros impressos
- Parte dos documentos gerados em aprovações e relatórios oficiais também está armazenada no sistema Onnara, o que pode permitir a recuperação de alguns dados se esse sistema for restaurado
Críticas ao sistema de gestão de dados
- Embora, no dia a dia, a maioria dos sistemas seja copiada diariamente para equipamentos separados dentro do centro e para instalações remotas de backup, o G-Drive tinha uma vulnerabilidade incomum, pois sua estrutura não permitia backup externo
- O incidente elevou as críticas ao sistema de segurança e gestão de dados do governo e reforçou a necessidade de medidas para evitar novos casos
1 comentários
Comentários do Hacker News
Fiquei indignado com o fato de não haver backup, mas quero entender melhor a situação antes de responsabilizar alguém de fato
Lembro que, quando trabalhei como meu primeiro responsável por computadores em 1990~1991, meu mentor me deu o conselho: "Seu trabalho é verificar se o backup está funcionando; o resto é lucro"
Na época, o sistema de backup em fita estava saturado, então comecei a replicar dados importantes entre dois locais por um modem de 14400bps, e deixei memorandos mensais pedindo um sistema de backup funcional, mas a empresa ignorou por causa do custo
Quando o disco rígido do servidor quebrou, parecia ser um problema no rolamento, então abri o gabinete do HD e girava o prato com o dedo para mantê-lo vivo por algumas semanas; fiz o gerente ver isso pessoalmente para mostrar a gravidade do problema, e no fim compraram um disco novo, mas não um disco extra para espelhamento
Um mês depois que saí da empresa, tentaram me culpar após uma falha no servidor, mas meu substituto encontrou o monte de memorandos que eu havia deixado e conseguiu corrigir a situação
No fim da matéria
É verdade que a própria tecnologia de LLM foi originalmente desenvolvida para tradução
A pesquisa avançou por causa da necessidade de criar modelos capazes de lidar com contexto, e depois isso acabou se mostrando útil em várias outras áreas
Na tradução, tecnologias baseadas em LLM já vêm sendo usadas com bom desempenho há mais de 5 anos
Trabalhei assim por muitos anos; mesmo antes dos LLM, entre idiomas que conheço bem, rodar primeiro uma tradução automática e depois corrigir sempre foi muito mais rápido do que traduzir tudo do zero
(Se a tradução automática é LLM ou não, isso na prática não é uma questão tão importante no fluxo real de trabalho)
Ainda acho que o resultado continua totalmente inútil
Veja o texto "A IA acabou com meu emprego de tradutor"
Compartilhou este link relacionado
O cronograma dá arrepios
O próprio dia em que ocorreu o incêndio era a data prevista para o início da inspeção in loco do governo (relacionada a ataques hackers da China/Coreia do Norte)
Citando esta matéria
Ver materiais cronológicos assim faz a gente desistir da ideia de enfrentar o poder e dizer o que é certo
Dá vontade de simplesmente apagar os dados, descartar os equipamentos e pegar um ônibus para outra cidade, atrás de outra profissão
Tentando ver pelo lado positivo, do ponto de vista técnico provavelmente até existia backup (ver seção 1.3)
O problema é o rumor de que esse backup estaria na Coreia do Norte ou na China
Assustador
Não é o ponto mais importante da matéria, mas não entendo por que até os autores do artigo continuam defendendo o Proton, mesmo depois de terem suas próprias contas suspensas
Isso apesar de haver um relato de que alguém ligado ao serviço de inteligência sul-coreano alertou que o Proton não é seguro
Mesmo que tecnicamente seja perfeitamente seguro, isso mostra que a empresa não tem uma bússola moral tão firme quanto as pessoas imaginam
Os burocratas do governo que diziam não ser possível confiar em AWS/GCP/Azure comerciais provavelmente vão ficar quietos por um tempo
"O Ministério do Interior e Segurança explicou que a maioria dos sistemas do centro de dados de Daejeon é copiada diariamente para equipamentos separados no mesmo centro e para uma instalação de backup fisicamente isolada, mas que, pela estrutura do G-Drive, o backup externo é impossível"
Acho uma situação realmente absurda
Acho que o problema aqui não é a recusa em usar empresas estrangeiras
O insano foi exigir o uso de armazenamento externo e, ainda assim, não fazer backup de verdade
Incêndio é um dos riscos mais básicos a considerar, e é inacreditável um nível tão ruim de gestão a ponto de nem isso estar preparado
Concordo que operar um sistema tão crítico sem backup é absurdo
Ainda assim, acho inadequado que um governo armazene dados importantes em nuvem estrangeira
Se tivessem usado nuvem, a redundância teria sido fácil de montar, mas esse não era o único caminho
O conceito de arquitetura já estava errado desde o início, e a estrutura não tinha redundância real
A solução simples para isso seria ter um site secundário de backup com
snapmirrorem vários NetApp, ou até usar soluções open source comoZFSeDRBDHoje em dia existem alternativas assim em quantidade suficiente para qualquer um usar
As pessoas tratam essas empresas como se nunca perdessem dados, mas já houve caso de raio destruir um data center (matéria relacionada)
Do ponto de vista do governo, os dados não deveriam estar em um ambiente administrado por uma empresa privada de outro país
Isso é uma questão completamente separada do problema de backup
Na prática é ainda pior
Segundo outra matéria, o volume total de dados do G-Drive era de 858 TB
A conta é um pouco caricata, mas em AWS S3 seria possível manter backup de tudo por US$ 20 mil por mês (cerca de 20 milhões de won)
Se tivessem migrado para “Glacier deep archive”, teria custado só US$ 900 por mês
Havia backup, mas tudo ficava na mesma sala de servidores (artigo 1, artigo 2)
Não dá para usar 30 GB por pessoa como média
Na prática, o uso médio provavelmente era algo em torno de 0,3 GB
Deixando os comentários da matéria de lado, ainda não está claro se realmente não havia backup nenhum
Parece certo que não havia backup "externo", mas pode ter havido backup "interno"
Se o modelo era centralizar tudo em um único lugar sem permitir backup externo, isso também pode ter sido uma medida para reduzir a exposição a ataques externos, e em muitos lugares há equipamentos de backup físico como
fire vault(cofre antiexplosão/contra incêndio)Claro, se nem isso existia, então foi um erro gigantesco
Só para referência, já havia exemplos em artigos acadêmicos de décadas atrás mostrando a viabilidade de montar esse tipo de infraestrutura de arquivamento (artigo do projeto IBM)
Curiosamente, algumas semanas atrás aconteceu algo parecido no Nepal
Manifestantes incendiaram alguns prédios do governo, a infraestrutura de TI foi destruída e, no fim, praticamente todos os dados eletrônicos evaporaram
Fico pensando se o resultado teria sido diferente caso esses documentos existissem em formato analógico
Dados eletrônicos têm a vantagem de poderem ser copiados em backup, mas mesmo que tudo fosse operado só em papel, não acho que a situação teria sido necessariamente melhor
Será que eram patriotas anti-autoritários?
Algo parecido também aconteceu no filme Blade Runner
Alguns dias atrás, o site de candidatura do GKS (Programa de Bolsas do Governo da República da Coreia para estudantes estrangeiros) ficou fora do ar por vários dias, e é chocante saber que os dados realmente foram todos perdidos
Acho que este é justamente o momento para construir um sistema de site melhor
Informações muito importantes na Coreia desapareceram num instante, então isso virou um grande assunto nas comunidades e muita gente está comentando
Tenho certeza de que uma parte considerável de dados valiosos desapareceu por completo, mas ao mesmo tempo isso quase me faz sorrir ao imaginar um aviso circulando pelo departamento responsável dizendo algo como: "se houver alguém de shadow IT operando um banco de dados espelho não oficial, pode se apresentar agora que ninguém vai ser responsabilizado"
Eu mesmo já fiz backups paralelos não oficiais quando os dados realmente essenciais mudavam o tempo todo, ou quando o servidor caía, travava ou se embaralhava
Muita gente diz que o problema foi a recusa em usar nuvem americana, mas não acho que esse seja o ponto central
Dependendo do contexto, operar infraestrutura própria pode ser uma decisão perfeitamente razoável
O maior problema neste caso foi sacrificar a "disponibilidade" em nome de segurança e privacidade
O risco de perder dados por desastre físico (incêndio, terremoto) ou erro humano sempre existe
Um sistema que não consegue evitar esse tipo de risco jamais deveria ser colocado em produção
Segundo o Ministério do Interior e Segurança, a maioria dos sistemas do centro de dados de Daejeon tem backup em outro lugar, mas o G-Drive, pela própria arquitetura, não permite backup externo
Ou seja, decidiram conscientemente aceitar esse risco, e o resultado foi exatamente este