- Em padrões de uso no estilo agente, usar via assinatura mostra uma relação custo-benefício 36x melhor
- O plano ‘Max 5x’ pode ser usado acima do que o marketing sugere, com limite por sessão 6x maior e limite semanal 8,3x maior
- O plano ‘Max 20x’ só escala 20x com base em sessões de 5 horas, e o limite semanal fica em apenas cerca de 2x o do Max 5x
- Na interface web, o custo para reutilizar contexto em cache é zero, enquanto na API existe a diferença de que, ao reenviar o mesmo contexto, há cobrança recorrente de 10% do custo de entrada
- Os números de limite da assinatura foram reconstruídos por engenharia reversa a partir de valores de uso em ponto flutuante, permitindo uma análise precisa da estrutura interna de créditos e tokens
Contexto da análise e abordagem
- Foi constatado que os valores decimais de uso anormalmente precisos exibidos na UI web do Claude vêm de cálculos internos
- Valores como
0.16327272727272726são estimados como resultados de um sistema interno de créditos baseado em frações - Para isso, foi usado um método de reversão para frações com a Stern–Brocot tree
- Valores como
- Com isso, torna-se possível reconstruir os limites reais por sessão, os limites semanais e a unidade de créditos
Diferença na estrutura de custos entre assinatura web e API
- A assinatura web do Claude não gera custo adicional de entrada ao referenciar repetidamente o mesmo contexto de conversa
- Na API, o mesmo contexto precisa ser reenviado a cada requisição e, mesmo com cache hit, 10% do custo dos tokens de entrada é cobrado
- Em padrões de uso como coding no estilo agente, que consome repetidamente contextos longos, a diferença de custo cresce rapidamente
Limitação real do plano ‘Max 20x’
- A marcação ‘20x’ se aplica apenas ao uso por sessão de 5 horas
- O limite acumulado semanal fica restrito a cerca de 2x o do Max 5x
- Ele é vantajoso para uso intenso em pouco tempo, mas perde eficiência em uso contínuo de longo prazo
Eficiência real do plano ‘Max 5x’
- O limite por sessão se expande para cerca de 6x em relação ao Pro
- O limite semanal aumenta para cerca de 8,3x em relação ao Pro
- Foi identificado como um plano em que a entrega real é maior do que o nome sugere
- Na faixa de US$ 100 por mês, oferece eficiência de custo esmagadoramente superior à da API
Conclusão sobre custo-benefício
- Em trabalhos longos de programação e desenvolvimento baseado em agentes, como com o Claude Code, a assinatura é muito mais vantajosa que a API
- Em especial, o plano ‘Max 5x’ é o ponto em que velocidade, continuidade e custo ficam mais equilibrados
- Pela estrutura atual, é a melhor opção para usuários avançados e desenvolvedores
Link do texto original: suspiciously precise floats, or, how I got Claude's real limits
Resumo dos comentários no Reddit
- No geral, os comentários mostram forte concordância de que a análise numérica do OP é válida
- Em especial, houve convergência na ideia de que o plano ‘Max 5x’ de US$ 100/mês é o melhor custo-benefício para heavy users
- Graças à estrutura em que a reutilização do cache de contexto é gratuita na UI web, a diferença de custo em relação à API aumenta muito em sessões longas e no estilo agente
- Mesmo entre usuários reais do Max 5x, muitos relataram que quase nunca chegam ao limite, mesmo usando o dia todo
- A afirmação de que “o Max 20x é uma armadilha” veio acompanhada de uma explicação complementar
- O limite total semanal fica em apenas 2x o do Max 5x
- Em compensação, o limite por sessão de 5 horas é 4x maior
- Com isso, consolidou-se a distinção de papéis: 20x para uso explosivo de curto prazo (sprints) e 5x para uso sustentado por longos períodos (maratona)
- O alerta mais forte levantado foi a falta de transparência da Anthropic
- Toda esta análise se baseia em números obtidos por engenharia reversa
- Os limites internos podem mudar sem aviso prévio
- Houve consenso de que isso é útil para otimização de custo no curto prazo, mas arriscado como base para decisões de negócio de longo prazo
- Como dica prática mais útil, destacou-se o modo de uso da extensão Claude Code para VS Code
- É possível fazer login com uma conta de assinatura do claude.ai em vez de usar chave de API
- Assim, é possível usar o limite da assinatura sem consumir créditos da API
- Muitos reagiram dizendo que não sabiam disso
- Como ponto adicional, foram mencionadas as diferenças de privacidade e de termos
- A UI web e a API têm Terms of Service diferentes
- Há a percepção de que, para código sensível ou proprietário, usar a API é mais seguro
- Também chamou atenção uma opinião contrária: a de que limites de uso podem até aumentar a produtividade
- Quanto mais próximo do ilimitado, maior a tendência de os prompts ficarem longos e ineficientes
- Os limites forçam um design de prompts mais enxuto e intencional
- No geral, o clima dos comentários foi de
- um consenso prático de que “neste momento, o Max 5x é a escolha ideal”
- junto com a cautela de que “essa estrutura pode mudar a qualquer momento”
2 comentários
Quando deixei 8 agentes rodando ao mesmo tempo, bati no limite rapidinho.
Isso é porque você não usa tanto assim.... quando você entra no ritmo do “doomchit dudumchit”, até 20x some num instante~