22 pontos por GN⁺ 2026-01-30 | 2 comentários | Compartilhar no WhatsApp
  • Em padrões de uso no estilo agente, usar via assinatura mostra uma relação custo-benefício 36x melhor
  • O plano ‘Max 5x’ pode ser usado acima do que o marketing sugere, com limite por sessão 6x maior e limite semanal 8,3x maior
  • O plano ‘Max 20x’ só escala 20x com base em sessões de 5 horas, e o limite semanal fica em apenas cerca de 2x o do Max 5x
  • Na interface web, o custo para reutilizar contexto em cache é zero, enquanto na API existe a diferença de que, ao reenviar o mesmo contexto, há cobrança recorrente de 10% do custo de entrada
  • Os números de limite da assinatura foram reconstruídos por engenharia reversa a partir de valores de uso em ponto flutuante, permitindo uma análise precisa da estrutura interna de créditos e tokens

Contexto da análise e abordagem

  • Foi constatado que os valores decimais de uso anormalmente precisos exibidos na UI web do Claude vêm de cálculos internos
    • Valores como 0.16327272727272726 são estimados como resultados de um sistema interno de créditos baseado em frações
    • Para isso, foi usado um método de reversão para frações com a Stern–Brocot tree
  • Com isso, torna-se possível reconstruir os limites reais por sessão, os limites semanais e a unidade de créditos

Diferença na estrutura de custos entre assinatura web e API

  • A assinatura web do Claude não gera custo adicional de entrada ao referenciar repetidamente o mesmo contexto de conversa
  • Na API, o mesmo contexto precisa ser reenviado a cada requisição e, mesmo com cache hit, 10% do custo dos tokens de entrada é cobrado
  • Em padrões de uso como coding no estilo agente, que consome repetidamente contextos longos, a diferença de custo cresce rapidamente

Limitação real do plano ‘Max 20x’

  • A marcação ‘20x’ se aplica apenas ao uso por sessão de 5 horas
  • O limite acumulado semanal fica restrito a cerca de 2x o do Max 5x
  • Ele é vantajoso para uso intenso em pouco tempo, mas perde eficiência em uso contínuo de longo prazo

Eficiência real do plano ‘Max 5x’

  • O limite por sessão se expande para cerca de 6x em relação ao Pro
  • O limite semanal aumenta para cerca de 8,3x em relação ao Pro
  • Foi identificado como um plano em que a entrega real é maior do que o nome sugere
  • Na faixa de US$ 100 por mês, oferece eficiência de custo esmagadoramente superior à da API

Conclusão sobre custo-benefício

  • Em trabalhos longos de programação e desenvolvimento baseado em agentes, como com o Claude Code, a assinatura é muito mais vantajosa que a API
  • Em especial, o plano ‘Max 5x’ é o ponto em que velocidade, continuidade e custo ficam mais equilibrados
  • Pela estrutura atual, é a melhor opção para usuários avançados e desenvolvedores

Link do texto original: suspiciously precise floats, or, how I got Claude's real limits


Resumo dos comentários no Reddit

  • No geral, os comentários mostram forte concordância de que a análise numérica do OP é válida
  • Em especial, houve convergência na ideia de que o plano ‘Max 5x’ de US$ 100/mês é o melhor custo-benefício para heavy users
  • Graças à estrutura em que a reutilização do cache de contexto é gratuita na UI web, a diferença de custo em relação à API aumenta muito em sessões longas e no estilo agente
  • Mesmo entre usuários reais do Max 5x, muitos relataram que quase nunca chegam ao limite, mesmo usando o dia todo
  • A afirmação de que “o Max 20x é uma armadilha” veio acompanhada de uma explicação complementar
    • O limite total semanal fica em apenas 2x o do Max 5x
    • Em compensação, o limite por sessão de 5 horas é 4x maior
    • Com isso, consolidou-se a distinção de papéis: 20x para uso explosivo de curto prazo (sprints) e 5x para uso sustentado por longos períodos (maratona)
  • O alerta mais forte levantado foi a falta de transparência da Anthropic
    • Toda esta análise se baseia em números obtidos por engenharia reversa
    • Os limites internos podem mudar sem aviso prévio
    • Houve consenso de que isso é útil para otimização de custo no curto prazo, mas arriscado como base para decisões de negócio de longo prazo
  • Como dica prática mais útil, destacou-se o modo de uso da extensão Claude Code para VS Code
    • É possível fazer login com uma conta de assinatura do claude.ai em vez de usar chave de API
    • Assim, é possível usar o limite da assinatura sem consumir créditos da API
    • Muitos reagiram dizendo que não sabiam disso
  • Como ponto adicional, foram mencionadas as diferenças de privacidade e de termos
    • A UI web e a API têm Terms of Service diferentes
    • Há a percepção de que, para código sensível ou proprietário, usar a API é mais seguro
  • Também chamou atenção uma opinião contrária: a de que limites de uso podem até aumentar a produtividade
    • Quanto mais próximo do ilimitado, maior a tendência de os prompts ficarem longos e ineficientes
    • Os limites forçam um design de prompts mais enxuto e intencional
  • No geral, o clima dos comentários foi de
    • um consenso prático de que “neste momento, o Max 5x é a escolha ideal
    • junto com a cautela de que “essa estrutura pode mudar a qualquer momento

2 comentários

 
00001 2026-01-31

Quando deixei 8 agentes rodando ao mesmo tempo, bati no limite rapidinho.

 
iolothebard 2026-01-30

Isso é porque você não usa tanto assim.... quando você entra no ritmo do “doomchit dudumchit”, até 20x some num instante~