- Foi reportado na plataforma Claude um estado de aumento da taxa de erros em vários modelos
- Os usuários podem assinar alertas de falhas e de resolução por e-mail ou mensagem de texto
- Os alertas por SMS permitem cadastro de números de cada país por meio de uma lista global de códigos de país
- Os assinantes podem receber atualizações por SMS após autenticação com OTP (senha de uso único)
- É um caso que mostra o sistema de monitoramento de incidentes dos serviços Claude operados pela Anthropic
Aviso de falha no serviço Claude
- Na página de status do Claude, foi comunicado um estado de taxa de erros elevada em vários modelos
- Exibido com a frase “Elevated errors across many models”
- Não há explicação sobre a causa específica nem sobre a extensão do impacto
Como assinar os alertas
- Os usuários podem receber alertas de atualização de incidentes por e-mail ou SMS
- O e-mail notifica sempre que o incidente é atualizado
- O SMS é enviado sempre que o Claude cria ou resolve um incidente
Procedimento de cadastro para alertas por SMS
- Para receber alertas por SMS, é necessário seguir o processo de selecionar o código do país → inserir o número de celular → autenticar com OTP
- É preciso inserir o OTP (senha de uso único) para validar o número
- Após a autenticação, é possível receber atualizações por SMS
Lista de países suportados
- A página inclui uma lista de códigos de país da maior parte do mundo
- Ex.: Estados Unidos (+1), Coreia do Sul (+82), Japão (+81), Reino Unido (+44), Alemanha (+49) etc.
- Usuários de cada país podem receber alertas por SMS seguindo o mesmo procedimento
O significado do monitoramento do status do serviço
- A página de status do Claude funciona como uma vitrine pública do estado de incidentes em tempo real dos serviços da Anthropic
- Oferece aos usuários uma função transparente de alerta de falhas e compartilhamento do progresso da recuperação
- É um sistema que permite a desenvolvedores e clientes corporativos verificar imediatamente a disponibilidade do serviço
1 comentários
Opiniões no Hacker News
Foi impressionante ver que a página de status foi atualizada assim que o problema ocorreu
Eu estava usando o Claude Code, recebi um erro de API e fui checar a página de status; a indisponibilidade já estava aparecendo lá
Acho que esse tipo de resposta transparente é algo que todo serviço deveria fazer por padrão
Por coincidência, eu mesmo estava usando o Claude naquele momento, então consegui perceber na hora a gravidade da falha
Pelo visto, os usuários do Claude trabalham duro até no domingo à noite
Eu sou um dos engenheiros de resposta a incidentes desta ocorrência
Às 14:43 PT / 22:43 UTC, mitigamos o problema. Pedimos desculpas pelo transtorno
Anúncios de rota duplicados fizeram com que parte do tráfego para alguns backends de inferência caísse em um black hole
Levamos cerca de 75 minutos para detectar isso, e alguns caminhos de mitigação não funcionaram como esperado
As rotas incorretas foram removidas e o serviço foi restaurado
Daqui para frente, vamos reforçar o synthetic monitoring e a visibilidade sobre mudanças na infraestrutura para detectar isso mais rápido
Graças a essa transparência, passei a confiar mais na Cloudflare
Imaginei uma distopia steampunk daqui a 50 anos
“A hospedagem de LLMs parou, a produção mundial foi interrompida e os mercados colapsaram. Sam, você está ouvindo?”
Só de pensar nisso já acho engraçado
Vídeo relacionado: YouTube Shorts
Recebi esta mensagem no chat do Claude.ai
Ou foi uma coincidência de timing perfeita, ou o pessoal de monetização merece um bônus
Talvez o backend não esteja retornando erro 429/402, ou o gateway esteja tratando isso incorretamente e devolvendo a mensagem errada
Se descontinuarem o Opus 4.5, vou chorar
Pouco antes da falha, o Opus começou a dar respostas estranhamente longas
Mesmo para perguntas simples, ele respondia como se estivesse despejando a base de código inteira, e numa pergunta simples sobre esquema de banco de dados houve compressão duas vezes
canivibe.ai — talvez dê para ajustar o vibe dependendo do serviço que você usar
Fiquei me perguntando se isso talvez não tenha sido uma falha da AWS
Pela página de status, parece que agora já foi restaurado
Vi um agente preso no mesmo loop de erro e, desta vez, ele conseguiu produzir o resultado corretamente
Fiquei com a impressão de que adicionaram alguma regra para detectar esse tipo de indisponibilidade automaticamente, e foi uma resposta bem inspiradora