1 pontos por p2c2kbf 2026-04-13 | Ainda não há comentários. | Compartilhar no WhatsApp

AIWatch é um projeto open source que monitora em tempo real falhas, uptime e tempo de recuperação de principais serviços de IA como Claude, OpenAI e Gemini.

Dashboard: https://ai-watch.dev
Landing page: https://ai-watch.dev/intro
GitHub: https://github.com/bentleypark/aiwatch

Quando ocorre uma falha, a IA analisa a causa, prevê o tempo de recuperação
e envia alertas imediatos por Discord/Slack.

Hoje divulgamos o relatório de confiabilidade de 27 serviços (base de março),
com base nos dados coletados entre 20 e 31 de março (12 dias). Como este é o primeiro relatório, o período é curto, e a partir de abril ele será publicado com os dados do mês completo.

3 principais descobertas

1. A porcentagem de uptime é incompleta
A Claude API registrou 99% de uptime, mas teve 9 incidentes em 12 dias.
A Cohere teve 100% de uptime e zero incidentes.
Olhando apenas os números, parecem parecidas, mas a confiabilidade real é totalmente diferente.

2. Incidentes curtos acumulados viram um grande problema
A Together AI teve o maior número de incidentes em 12 dias, com 20 ocorrências,
mas o tempo médio de recuperação foi de 25 minutos e o downtime total foi de 8h 37min.
Já o ChatGPT teve 4 incidentes, mas um deles durou 19h 46min.

3. Risco de dependência upstream
A falha de 74 horas no Voice Agent da Deepgram começou com uma falha na OpenAI.
Serviços que colocam uma IA sobre outra IA herdam diretamente as falhas do serviço superior.


Top 5 do AIWatch Score (base de março)

Serviço Score Classificação Incidentes
Cohere API 100 Excellent 0
Hugging Face 100 Excellent 0
OpenRouter 99 Excellent 0
Groq Cloud 93 Excellent 1
DeepSeek API 92 Excellent 1
OpenAI API 88 Excellent 1 (2h 56min)
Together AI 84 Good 20 (média 25min)
ChatGPT 73 Good 4 (máx. 19h 46min)
Claude API 59 Fair 9 (agregado por modelo)
ElevenLabs 47 Degrading 2 (máx. 4h 47min)

Fórmula do Score (base do relatório de março): Uptime(50) + dias afetados por incidentes(30) + tempo de recuperação(20) = máximo de 100 pontos
Como o critério é dias afetados (affected_days), e não número de incidentes, é possível fazer uma comparação justa independentemente da forma de reporte.
Metodologia completa: https://ai-watch.dev/#about-score

A ElevenLabs, com uptime de 97,55%, foi o único entre os 27 serviços a receber classificação Degrading.
Se você usa serviços de voz/áudio em produção, é preciso ter cautela.


Observações

  • Como este é o primeiro relatório, o período monitorado de 20 a 31 de março (12 dias) traz dados parciais.
    A partir de abril, ele será publicado com os dados do mês completo.

Recomendações por uso (base do relatório de março)

  • Crítico para produção: Cohere (100 pontos, 0 incidentes), OpenAI API (88 pontos, 1 incidente / downtime total de 2h 56min)
  • Baixa latência / estabilidade: Groq Cloud (93 pontos, 100% de uptime), DeepSeek API (92 pontos)
  • Fluxo de trabalho de programação: Cursor, Windsurf (alto uptime)
  • Voz/áudio: AssemblyAI recomendado + fallback obrigatório (múltiplas falhas em ElevenLabs e Deepgram)

Ainda não há comentários.

Ainda não há comentários.