1 pontos por GN⁺ 2025-12-15 | 1 comentários | Compartilhar no WhatsApp
  • Foi reportado na plataforma Claude um estado de aumento da taxa de erros em vários modelos
  • Os usuários podem assinar alertas de falhas e de resolução por e-mail ou mensagem de texto
  • Os alertas por SMS permitem cadastro de números de cada país por meio de uma lista global de códigos de país
  • Os assinantes podem receber atualizações por SMS após autenticação com OTP (senha de uso único)
  • É um caso que mostra o sistema de monitoramento de incidentes dos serviços Claude operados pela Anthropic

Aviso de falha no serviço Claude

  • Na página de status do Claude, foi comunicado um estado de taxa de erros elevada em vários modelos
    • Exibido com a frase “Elevated errors across many models”
    • Não há explicação sobre a causa específica nem sobre a extensão do impacto

Como assinar os alertas

  • Os usuários podem receber alertas de atualização de incidentes por e-mail ou SMS
    • O e-mail notifica sempre que o incidente é atualizado
    • O SMS é enviado sempre que o Claude cria ou resolve um incidente

Procedimento de cadastro para alertas por SMS

  • Para receber alertas por SMS, é necessário seguir o processo de selecionar o código do país → inserir o número de celular → autenticar com OTP
    • É preciso inserir o OTP (senha de uso único) para validar o número
    • Após a autenticação, é possível receber atualizações por SMS

Lista de países suportados

  • A página inclui uma lista de códigos de país da maior parte do mundo
    • Ex.: Estados Unidos (+1), Coreia do Sul (+82), Japão (+81), Reino Unido (+44), Alemanha (+49) etc.
    • Usuários de cada país podem receber alertas por SMS seguindo o mesmo procedimento

O significado do monitoramento do status do serviço

  • A página de status do Claude funciona como uma vitrine pública do estado de incidentes em tempo real dos serviços da Anthropic
    • Oferece aos usuários uma função transparente de alerta de falhas e compartilhamento do progresso da recuperação
    • É um sistema que permite a desenvolvedores e clientes corporativos verificar imediatamente a disponibilidade do serviço

1 comentários

 
GN⁺ 2025-12-15
Opiniões no Hacker News
  • Foi impressionante ver que a página de status foi atualizada assim que o problema ocorreu
    Eu estava usando o Claude Code, recebi um erro de API e fui checar a página de status; a indisponibilidade já estava aparecendo lá
    Acho que esse tipo de resposta transparente é algo que todo serviço deveria fazer por padrão

    • O hábito de divulgar o incidente assim que o impacto aos usuários começa é um instinto que adquiri trabalhando como SRE no Google e na Anthropic
      Por coincidência, eu mesmo estava usando o Claude naquele momento, então consegui perceber na hora a gravidade da falha
    • Eu também conferi a página de status 2 minutos depois de ter o problema, e ela já estava atualizada
    • Eu estava depurando um erro 529, e essa indisponibilidade me deixou confuso por um tempo
    • Aconteceu o mesmo comigo, e assim que vi a página de status cliquei em assinar atualizações
      Pelo visto, os usuários do Claude trabalham duro até no domingo à noite
  • Eu sou um dos engenheiros de resposta a incidentes desta ocorrência
    Às 14:43 PT / 22:43 UTC, mitigamos o problema. Pedimos desculpas pelo transtorno

    • Também sou engenheiro da mesma equipe, e a causa foi um erro de configuração no roteamento de rede
      Anúncios de rota duplicados fizeram com que parte do tráfego para alguns backends de inferência caísse em um black hole
      Levamos cerca de 75 minutos para detectar isso, e alguns caminhos de mitigação não funcionaram como esperado
      As rotas incorretas foram removidas e o serviço foi restaurado
      Daqui para frente, vamos reforçar o synthetic monitoring e a visibilidade sobre mudanças na infraestrutura para detectar isso mais rápido
    • Fico curioso se há planos de publicar um relatório de análise do incidente, como a Cloudflare faz
      Graças a essa transparência, passei a confiar mais na Cloudflare
    • Foi complicado justamente quando eu precisava muito perguntar algo ao Claude e ele não estava funcionando
    • Espero que você consiga terminar bem o fim de semana
    • Como desenvolvedor, tenho curiosidade genuína sobre como esse tipo de problema acontece em ambientes de deploy em larga escala
  • Imaginei uma distopia steampunk daqui a 50 anos
    “A hospedagem de LLMs parou, a produção mundial foi interrompida e os mercados colapsaram. Sam, você está ouvindo?”
    Só de pensar nisso já acho engraçado

    • A ideia de que todo mundo usaria os mesmos três provedores centralizados de inferência é tão irreal quanto imaginar que hoje todo mundo está atrás da us-east-1 e da Cloudflare
    • Não seria muito diferente de uma situação em que a internet ou a Cloudflare saíssem do ar
    • Lembrei que o Karpathy chamou esse tipo de falha de “intelligence brownout”
      Vídeo relacionado: YouTube Shorts
    • Vem à mente algo como “apenas um coder solitário, habilidoso em manipulação simbólica, permaneceu entre a humanidade e a escuridão”
    • Dá para imaginar a piada: “criamos o problema com vibe coding, e agora o LLM caiu e não dá para consertar no vibe”
  • Recebi esta mensagem no chat do Claude.ai

    "You have reached the messages quota for your account. It will reset in 2 hours, or you can upgrade now"
    

    Ou foi uma coincidência de timing perfeita, ou o pessoal de monetização merece um bônus

    • Provavelmente o tratamento de erros não foi implementado direito
      Talvez o backend não esteja retornando erro 429/402, ou o gateway esteja tratando isso incorretamente e devolvendo a mensagem errada
    • Eu também vi essa mensagem e achei que fosse só questão de timing
  • Se descontinuarem o Opus 4.5, vou chorar

    • Já tinha gente parecendo viciada ao pedir mais créditos de API
    • Todo mundo parece bem satisfeito com o preço
  • Pouco antes da falha, o Opus começou a dar respostas estranhamente longas
    Mesmo para perguntas simples, ele respondia como se estivesse despejando a base de código inteira, e numa pergunta simples sobre esquema de banco de dados houve compressão duas vezes

  • canivibe.ai — talvez dê para ajustar o vibe dependendo do serviço que você usar

    • O site é legal, mas em apps de chat como o Discord os embeds não funcionam muito bem
    • Disponibilidade de 89% é um número meio de brincadeira
    • O nome “Vibedetector” cairia perfeitamente
  • Fiquei me perguntando se isso talvez não tenha sido uma falha da AWS

  • Pela página de status, parece que agora já foi restaurado
    Vi um agente preso no mesmo loop de erro e, desta vez, ele conseguiu produzir o resultado corretamente
    Fiquei com a impressão de que adicionaram alguma regra para detectar esse tipo de indisponibilidade automaticamente, e foi uma resposta bem inspiradora