1 pontos por GN⁺ 2025-10-30 | 1 comentários | Compartilhar no WhatsApp
  • Foi relatada a ocorrência de uma falha (outage) no serviço de nuvem Azure da Microsoft
  • A postagem no Hacker News foi escrita pelo próprio usuário no formato de um aviso informando a falha
  • A causa, o alcance do impacto e o status de recuperação da falha não são mencionados em detalhes no texto
  • A postagem tem como objetivo alertar os usuários dos serviços Azure
  • É um caso que relembra a importância de reconhecer os riscos operacionais para empresas e desenvolvedores com alta dependência de infraestrutura em nuvem

Relato de falha no serviço Azure

  • A postagem “Tell HN: Azure outage” no Hacker News informa a ocorrência de uma falha na plataforma Azure
  • Como o conteúdo principal não foi extraído, não é possível verificar detalhes como causa, região afetada ou tipo de serviço
  • Pelo formato da postagem, parece que um usuário testemunhou a falha e a compartilhou com a comunidade

Informações adicionais

  • Microsoft Azure é um serviço de computação em nuvem usado mundialmente
  • O texto não inclui o andamento da recuperação nem anúncios oficiais
  • Não há informações adicionais no original

1 comentários

 
GN⁺ 2025-10-30
Opiniões no Hacker News
  • Ainda é surpreendente que serviços essenciais, especialmente o transporte público, dependam completamente da nuvem e não tenham backup
    Hoje é dia de eleição geral na Holanda, e por causa da falha no Azure alguns trens atrasaram ou foram cancelados por horas, então houve gente que não conseguiu votar

    • Fico me perguntando se a votação acontece em um único dia. Se for só um dia, esse tipo de problema pode acontecer a qualquer momento. Deve haver um bom motivo para fazer isso ao longo de vários dias
    • É inacreditável que, mesmo em 2025, ainda seja preciso ir pessoalmente ao local de votação. Eu voto pelo correio há mais de 20 anos, recebo a cédula com 1 mês de antecedência e envio de volta pelo correio. Espero que algum dia tenhamos votação online para acabar com esse desperdício de papel
    • Acho que o dia da eleição deveria ser um feriado nacional
    • Mas, se você implanta em duas nuvens, é criticado por desperdiçar dinheiro do contribuinte. No fim, é preciso escolher entre confiabilidade e redução de custos
    • A Nova Zelândia também não escapou desta falha. O serviço governamental RealME (declaração de impostos, pedido de passaporte etc.) parou, causando grande confusão
  • Segundo o aviso na página de status do Azure, alguns serviços ficaram indisponíveis por volta de 16:00 UTC no Azure Status devido a um problema no Front Door
    Orientaram clientes sem acesso ao portal a usarem PowerShell ou CLI, e disseram que estavam separando o portal do AFD para restaurá-lo

    • Na atualização das 17:17 UTC, informaram que a causa mais provável era uma mudança de configuração incorreta. Disseram que bloquearam todas as mudanças e estavam fazendo rollback para o último estado saudável
    • Na Europa, o AFD frequentemente cai por região. Mais da metade das vezes isso nem chega a ser reportado oficialmente
    • Como mencionaram DNS, fico curioso se isso é parecido com uma antiga falha da AWS
    • A mensagem de status reconheceu o problema no AFD, mas só mencionou medidas para fazer o portal funcionar sem depender dele. Para quem usa AFD, isso talvez vire uma maratona
    • Não foi só o portal: o microsoft.com também caiu
  • O pedido móvel da Starbucks não funcionava, então tentei pedir pelo Grubhub, mas lá também estava fora do ar. Acabei vindo ao HN para descobrir a causa

    • O HN parece mais estável que a nuvem, já que roda em alguns servidores no porão
    • O subreddit de sysadmin detectou a falha mais de uma hora antes do HN. Os engenheiros de plantão perceberam imediatamente
    • Na antiga falha da AWS, o app da Starbucks também parou
    • Eu achei estranho a fila do drive-thru não andar, mas era por isso
    • Meu sensor de qualidade do ar da Netatmo também parou de enviar alertas. Fico me perguntando por que dados da minha própria casa precisam passar pela nuvem
  • A falha do Azure não é tão chocante quanto uma falha da AWS.
    No começo, a integração vertical do ecossistema da Microsoft parecia atraente, mas quando usei na prática achei a alocação de recursos muito incômoda, então voltei para a AWS
    Ainda nunca usei GCP, mas estou pensando que talvez fosse melhor

    • Quando usei Azure pela primeira vez, os menus eram tão complexos que cobriam a tela inteira. Foi a primeira vez que senti que estava perdido na nuvem
    • Sinceramente, o GCP é bem bom. Queria que mais gente testasse
    • Mas em setores fortemente regulados, só a Microsoft é permitida. AWS e GCP nem entram em consideração
    • A Microsoft lida bem com conformidade regulatória no setor público, então tem muitos clientes governamentais. Por isso uma falha no Azure afeta mais os serviços públicos
    • Na verdade, se a MS cair mas o Github continuar de pé, talvez muita gente nem perceba
  • Neste momento estou dentro de um supermercado meio fechado porque o sistema de pagamentos parou

    • O mercado onde eu trabalhava tinha modo offline, então às vezes, quando a autorização do pagamento falhava, o cliente levava as compras de graça
    • O Family Dollar aqui perto sempre para uns dois dias por mês por problemas de internet. Se eu fornecesse um link de backup e ficasse com metade da receita, seria vantajoso para ambos
    • Neste supermercado não foi uma queda total, mas parece que estava dando timeout na etapa de pagamento, então tudo ficou muito lento
    • Isso me lembrou dos anos 90, quando as caixas registradoras mecânicas estavam sendo trocadas por eletrônicas. Hoje em dia, já paguei flores em dinheiro porque a maquininha entrou em loop de inicialização. Minha parceira brincou que a atendente queria embolsar o dinheiro sem imposto
    • Acho que qualquer varejista deveria ter pelo menos pagamento offline
  • Agora estou pensando em migrar para Google Cloud Run ou Cloudflare Workers
    Pessoalmente, confio na Hetzner pelo bom custo-benefício
    Já vi vídeos comparativos sobre isso, e seria bom se sites como vpspricetracker.com também mostrassem pontuações do Geekbench

    • A Hetzner é boa, mas provavelmente não está no nível de estabilidade do Google
    • Fico pensando se não seria melhor montar algo multi-provider
    • Vale lembrar que, há 4 meses, uma falha da Cloudflare também teve origem em um problema no Google Cloud
  • Nos últimos 2 anos, estou migrando meus serviços lentamente para fora do Azure.
    O que restou por último são um bucket de ativos estáticos e uma VM para análise com Matomo, mas a experiência com o Front Door foi tão horrível que o ocorrido de hoje me fez decidir migrar de vez para a Cloudflare

    • Na verdade, este ano todas as nuvens tiveram grandes falhas. Nenhuma delas consegue mais garantir confiabilidade absoluta
    • Mesmo assim, é importante transformar momentos de crise em oportunidade
  • O login.microsoftonline.com caiu, então o SSO parou na empresa inteira. O microsoft.com também morreu junto

    • Nos tenants dos EUA, o fluxo de login trava, mas na Europa (especialmente germany-west) está funcionando normalmente
    • Na nossa empresa, SSO e 365 estão OK, mas só o portal de administração está inacessível
    • Agora estão brincando que entramos em modo NASSO (Not A Single Sign On)
    • Hoje em dia, as falhas do Office 365 acontecem quase semanalmente, e ainda assim é curioso que continuem adotando isso
  • O download do VSCode falha
    O link de download não funciona

    • Hoje o winget também falhou de forma intermitente. Eu uso UniGetUI, e só os pacotes relacionados à Microsoft não atualizam a lista
    • Os repositórios do Azure DevOps também estão inacessíveis, então o trabalho parou
    • Também sugeriram usar VSCodium em vez disso
  • Nossa equipe é 100% baseada em Azure, mas não foi impactada por esta falha
    Desde que abandonamos o Front Door há 1 ano, tudo ficou estável. Antes, havia problemas a cada novo deploy, e uma vez chegou a aparecer um banner da Microsoft na homepage, algo absurdo

    • Passamos mais de 1 ano sofrendo com o problema Front Door OriginTimeout e acabamos migrando. Mas os servidores de API ainda estão atrás do AFD, então foram afetados desta vez também
    • Mais grave do que a indisponibilidade é o problema de contaminação de conteúdo. Aparecer um banner da Microsoft sem nem sermos assinantes é algo bem sério mesmo