GitHub Actions ficou fora do ar
(githubstatus.com)- A página de status do GitHub mostra atualmente All Systems Operational, e em 27 de maio de 2026 não há incidentes reportados
- Nos últimos 90 dias, todos os principais componentes aparecem como Operational, e a disponibilidade do Actions é de 99,66%, enquanto Pull Requests está em 99,55%
- Em 26 de maio, Actions e Pages tiveram falhas ao iniciar execuções e ao baixar actions por causa de um problema de autenticação, afetando a maior parte das execuções do Actions
- Em 20 de maio, o atraso no Actions foi causado por um health check configurado incorretamente, e 4,5% de todas as execuções e 30% dos trabalhos em scale set sofreram atraso
- Em 15 de maio, a degradação do Actions ocorreu por um problema de roteamento durante um failover planejado, e no pico 42% das execuções falharam
Estado atual do serviço
- A página de status do GitHub está marcada atualmente como All Systems Operational
- Em 27 de maio de 2026, aparece nenhum incidente reportado
- Nos últimos 90 dias, todos os principais componentes estão em estado Operational
- Git Operations: 99.83% de disponibilidade
- Webhooks: 99.73% de disponibilidade
- API Requests: 99.98% de disponibilidade
- Issues: 99.86% de disponibilidade
- Pull Requests: 99.55% de disponibilidade
- Actions: 99.66% de disponibilidade
- Packages: 99.98% de disponibilidade
- Pages: 99.96% de disponibilidade
- Copilot: 99.91% de disponibilidade
- Codespaces: 99.77% de disponibilidade
- Copilot AI Model Providers: 100.0% de disponibilidade
- A página de status regional do GitHub Enterprise Cloud também é fornecida separadamente
Incidente de Actions e Pages em 26 de maio de 2026
-
Incidente de Actions e Pages
- Às 10:57 UTC, começou a investigação sobre a degradação de desempenho de Actions e Pages
- Às 11:19 UTC, foi confirmada a redução de disponibilidade do Actions
- Às 11:53 UTC, estava em investigação um problema de autenticação que causava falhas ao iniciar execuções do Actions e ao baixar actions, e naquele momento a maior parte das execuções do Actions estava sendo afetada
- Às 12:37 UTC, a causa do problema de autenticação que afetava o GitHub Actions foi identificada e o trabalho de mitigação estava em andamento
- Às 13:00 UTC, a degradação de Actions e Pages foi mitigada e o status passou para monitoramento para confirmar a estabilidade
- Às 13:18 UTC, o incidente foi resolvido, e uma análise detalhada da causa raiz seria compartilhada assim que estivesse pronta
Incidente do Actions em 20 de maio de 2026
-
Incidente do Actions
- Entre 16:00 e 17:45 UTC, clientes do GitHub Actions sofreram atrasos de mais de 5 minutos para iniciar execuções
- Durante o período afetado, cerca de 4.5% de todas as execuções sofreram atraso, e os trabalhos em scale set foram mais impactados
- 30% dos trabalhos em scale set sofreram atraso e 4% nem chegaram a iniciar
- A causa foi um health check configurado incorretamente em um serviço interno que atribui trabalhos aos runners
- Um curto aumento de latência em uma dependência upstream provocou falhas no health check em vários pods, e esses pods foram removidos do serviço, concentrando a carga na capacidade restante
- A carga adicional levou a pressão de memória, e uma falha em cascata se ampliou em um cluster regional, tornando a autorrecuperação impossível
- A resposta consistiu em expandir a capacidade do cluster regional saudável e retirar o tráfego do cluster regional afetado, após o que os atrasos no início das execuções se recuperaram
- Para evitar recorrência, o GitHub está reforçando a configuração do health check para evitar cenários de falha em cascata e avaliando medidas automáticas de mitigação para redistribuir tráfego em caso de degradação regional
- Às 20:14 UTC, o incidente foi resolvido
Redução de disponibilidade do Actions em 15 de maio de 2026
-
Redução de disponibilidade do Actions
- Entre 07:43 e 08:48 UTC, alguns clientes do GitHub Actions enfrentaram falha na execução de workflows ou atraso no início
- O incidente começou durante um failover planejado da infraestrutura de suporte usada pelo GitHub Actions
- Durante o failover, atualizações automáticas de service discovery não foram propagadas corretamente, o que roteou o tráfego de forma incorreta e aumentou os timeouts em uma dependência crítica da orquestração de workflows
- No pico do impacto, 42% das execuções do Actions falharam
- Serviços downstream que dependem da execução de workflows do Actions também foram afetados, incluindo GitHub Pages e serviços em nuvem do Copilot
- Às 08:12 UTC, os responsáveis corrigiram manualmente o problema de roteamento do service discovery
- Os timeouts e a taxa de falhas se recuperaram logo depois, e o monitoramento continuou até que todos os serviços afetados estivessem estabilizados
- Para evitar recorrência, estão em andamento guardrails de failover para validar o estado do service discovery antes da conclusão do failover, reforço das validações pré e pós-evento, e melhorias de resiliência das dependências para reduzir cascatas de timeout durante eventos de infraestrutura
- Às 08:48 UTC, o incidente foi resolvido
1 comentários
Comentários no Hacker News