1 pontos por GN⁺ 2025-07-29 | 1 comentários | Compartilhar no WhatsApp
  • Foi introduzido um limite semanal de uso para o serviço Claude Code da Anthropic
  • Aplica-se tanto a usuários gratuitos quanto pagos
  • Os usuários passam a ter restrições no número máximo de consultas ou na quantidade de tokens processados por semana
  • A adoção do limite tem como objetivo evitar o uso indevido do serviço e garantir a estabilidade dos recursos do sistema
  • Desenvolvedores e startups precisam ter atenção redobrada ao gerenciamento de recursos ao usar a API

Visão geral da introdução do limite semanal de uso do Claude Code

A Anthropic passou a aplicar uma nova política de limite semanal de uso ao serviço Claude Code

  • Foi definido para todos os usuários (gratuitos e pagos) um limite de uso de consultas ou tokens
  • Esse limite foi introduzido para evitar abuso do serviço, oferecer um serviço justo e garantir a estabilidade dos recursos de infraestrutura
  • O limite é redefinido toda semana, e, se for excedido, não será possível continuar usando o serviço até a semana seguinte

Principais impactos para desenvolvedores e startups

  • Aumenta a necessidade de planejamento de uso ao utilizar o Claude Code no desenvolvimento de produtos
  • Serviços integrados à API passam a exigir lógica de gerenciamento automatizado ou alertas de excesso de limite
  • Ao realizar geração de código em grande escala, análise ou chamadas repetidas, cresce a importância de otimizar o uso de recursos

Conclusão

  • A introdução da política de limite semanal de uso do Claude Code tem como objetivo a sustentabilidade e a melhoria da qualidade do serviço
  • Startups e profissionais de TI precisam verificar os limites semanais e planejar o uso ao integrar sistemas existentes e projetar serviços

1 comentários

 
GN⁺ 2025-07-29
Comentários no Hacker News
  • Acho que provavelmente não vou atingir o limite semanal, mas me incomoda que o limite seja semanal e não algo como uma janela de 36 horas
    Se eu bater no limite, fico sem poder usar pelo resto da semana
    É inconveniente ficar tanto tempo sem uma ferramenta à qual já me acostumei
    Alguém pode dizer que estou dependente demais do Claude, mas o mesmo vale para outras ferramentas como o ripgrep
    Ficar alguns dias sem usar até vai, mas uma semana é tempo demais
    E também chamou atenção o fato de terem dito que isso afeta “menos de 5% dos usuários”
    Normalmente esse tipo de aviso fala em menos de 1%, mas a Anthropic está dizendo que 1 em cada 20 pessoas vai passar do limite

    • No plano ChatGPT Plus, a sensação do limite de 100 usos/semana do o3 é exatamente essa
      Você nem consegue saber quanto já usou e, por ser um recurso importante, acaba economizando por instinto
      No fim, não aproveita o plano direito e muda para modelos como o o4-mini
      Eu preferiria um limite diário
      Mas talvez a intenção do limite semanal seja justamente fazer as pessoas economizarem e ficarem abaixo dele

    • É triste ver desenvolvedores ficando dependentes de serviços online proprietários
      Antigamente dava para fazer tudo com ferramentas FOSS, sem precisar ficar preso a uma empresa ou serviço específico pagando assinatura mensal
      Agora alguns estão como fazendeiros da Monsanto, pagando todo mês para usar as ferramentas e esquecendo como trabalhar sem isso

    • Eu atinjo o limite diário do Pro com sonnet com frequência, umas 3 vezes por dia
      Se eu usar Claude Code e claude juntos, acaba em 30 minutos
      Nem fico com multiagentes 24/7 nem várias janelas abertas, e mesmo assim acontece
      Não me considero um usuário top 5%, mas também não me surpreenderia acabar o limite na quarta-feira
      Eu só agora estava tentando usar mais o chat do Claude, mas se não dá para confiar nele por vários dias, então não faz sentido

    • A Anthropic disse que 1 em cada 20 pessoas vai bater no limite, mas não parece plausível que existam tantos usuários compartilhando conta ou usando automação 24/7

    • Se você bater no limite, não fica sem usar pela semana inteira, só pelo tempo restante
      A própria pessoa disse que provavelmente quase nunca vai chegar nisso, então, se chegar, deve ser nas últimas 36 horas da semana
      Também existe a opção de pagar pelo uso via API

  • Não sei como isso vai evoluir no longo prazo, mas é ruim ter que sentir toda vez que usa um LLM que aquilo é um recurso limitado
    As pessoas estão acostumadas a planos ilimitados
    O modelo de cobrança atual parece forçado e desconfortável

    • O modelo ilimitado funciona bem para serviços que são “baratos demais para medir”
      Internet, SMS e afins podem ser assim porque o custo direto é muito baixo
      Mas LLM ainda tem um custo direto considerável a cada execução

    • Não concordo com a ideia de esperar uso constante ao longo do mês inteiro
      Eu normalmente uso pouco ao longo do mês, mas às vezes passo alguns dias usando 11 horas por dia, e nessas horas é bem provável eu bater no limite
      Por isso usar a API diretamente parece melhor, porque aí o limite é a profundidade da minha carteira
      Usando algo como OpenRouter, você também evita as limitações do modelo por assinatura
      Hoje em dia o Gemini 2.5 Pro está servindo melhor que o Claude para trabalho com código
      Também tenho curiosidade sobre que outras opções competitivas em custo existem
      https://docs.anthropic.com/en/api/rate-limits#rate-limits

    • Na minha opinião, essas ferramentas deveriam abandonar de vez esse modelo de “US$ 20 por mês”, “US$ 200 por mês” para dar acesso a uma quantidade limitada e com cálculo de limite difícil de entender
      Deveriam migrar totalmente para uso medido, o que seria muito mais amigável para o usuário
      Poderiam oferecer um free tier como 20 usos grátis para teste, ou uma tabela progressiva em que a proporção muda conforme o volume, e cobrar dos usuários extremos mais perto do custo real
      Assim, quem usa pouco pagaria barato e eles ainda ganhariam participação de mercado
      Se oferecerem preço melhor que o OpenRouter, as pessoas ficarão nesse ecossistema em vez de ir para ferramentas de terceiros
      Se a ferramenta for realmente boa, os usuários ficam mesmo sendo por uso
      O problema é que os provedores querem subsidiar usuários para ganhar mercado, mas ao mesmo tempo impedir abuso e uso extremo
      A solução 100% correta é um modelo totalmente baseado em consumo, sem taxa de entrada
      Mas aí quem assina e usa pouco pode acabar perdendo, então imagino que o time comercial vá se opor
      Além disso, isso facilitaria comparar preços e migrar entre serviços, sem aquela sensação de ficar preso por um ou dois meses

    • No longo prazo, acho que os LLMs locais vão ficar melhores que os melhores LLMs em nuvem de 2025, então 99% do trabalho cotidiano será resolvido de forma ilimitada localmente
      E só problemas realmente complexos vão exigir conexão com a nuvem
      Os LLMs vão evoluir em eficiência, e os custos de GPU, memória e armazenamento vão continuar caindo e ficando mais acessíveis
      Agora só parece desconfortável porque ainda estamos numa fase de transição

    • Mesmo sendo um recurso limitado, eu aceitaria se ao menos desse para saber quanto já usei
      O ruim é não conseguir ver o progresso

  • Estou confuso com a diferença entre Max 5x e Max 20x
    No meu e-mail diz que “a maioria dos usuários do Max 20x pode usar Sonnet 4 por 240 a 480 horas por semana e Opus 4 por 24 a 40 horas”
    No anúncio oficial diz que “a maioria dos usuários do Max 5x pode usar Sonnet 4 por 140 a 280 horas por semana e Opus 4 por 15 a 35 horas”
    Eu preferiria que o limite fosse mais que o dobro, proporcional ao preço, mas no Opus 4 a diferença é só de 5 a 9 horas
    No mínimo não deveria ser o dobro? Já que custa o dobro

    • Se for realmente assim, eu vou descer imediatamente do Max 20x para um plano inferior
      Na Austrália estou pagando US$ 350 por mês

    • Eu vivia batendo no limite do Opus e fiz upgrade para 20x, mas agora parece que quase não existe diferença entre 20x e 5x

    • Foi por isso que parei de usar o MAX e fiz downgrade para o Pro, usando o o3 e outros modelos via API
      No começo eu não preciso de tantas horas assim, então uns US$ 10 por projeto bastam para usar o o3, Gemini e Opus
      Sai modelo novo a cada poucos dias, e eu não quero ficar preso a um único fornecedor

    • Na prática, não é o dobro de uso, e sim prioridade maior quando o tráfego está congestionado

    • Se o material de marketing diverge da realidade, eu gostaria que alguém investigasse com dados reais e abrisse uma ação coletiva

  • Entendo que mesmo pagando US$ 200 por mês talvez ainda não seja suficiente
    Então eles deveriam criar um plano realmente suficiente para usar sem se preocupar com limite
    Não existe nada que quebre mais o fluxo do que uma mensagem tipo “acabou o tempo!”
    Se fosse por créditos, pelo menos daria para ver quanto foi gasto e pagar mais se necessário
    Esse conceito de “esperar enquanto as GPUs esfriam” não ajuda em nada na produtividade
    Se você roda vários agentes, “35 horas” está muito longe de ser suficiente
    Também é estranho a ferramenta em si ser projetada para dar suporte a esse tipo de uso

    • Para virar um plano suficiente para todos e ainda lucrativo, talvez no fim todo mundo fugisse para a concorrência
      Pode até ser uma boa estratégia fazer os usuários dependerem da ferramenta e depois subir os preços aos poucos

    • “Rodar vários agentes” não me parece um caso de uso comum para um plano individual
      Nesses casos, sempre fez mais sentido pagar pelo uso diretamente via API
      Permitir isso em um plano fixo já era uma generosidade do serviço, e desde o começo ele foi anunciado como “limites mais altos”, não como “ilimitado”

    • A API tem limites muito mais flexíveis e, na prática, quase não tem restrições
      O Claude também pode ser usado pela Aws e gcp, com limites, créditos e tabelas de preço diferentes

    • A política deveria ser otimizada para os “bons usuários”, não moldada em torno dos “maus usuários”

    • É só usar a API

  • No geral, acho que é uma mudança positiva para proteger o sistema quando alguns usuários rodam muitos agentes 24/7
    Assim mais gente consegue continuar usando o serviço de forma estável
    Mas é chato não mostrarem “quanto uso ainda resta”
    Não precisa mostrar a porcentagem exata, mas pelo menos alguns avisos no caminho, por exemplo quando você chegar na metade, já ajudariam bastante no planejamento
    O fato de não oferecerem isso faz parecer que “não querem que a gente consiga medir”
    Não é que eu queira controlar tudo minuciosamente, só queria ter uma noção aproximada de onde estou

  • Segundo a conta da Anthropic no Reddit
    um usuário consumiu dezenas de milhares de dólares em LLM com um plano de US$ 200
    A empresa está desenvolvendo uma solução separada para usuários avançados
    Mas os novos limites existem para dar uma experiência mais justa e impedir compartilhamento de conta e revenda
    Por isso a gente não pode ter “um serviço bom”

    • Uma startup em que trabalhei também já ofereceu uma opção ilimitada
      No começo achávamos que ninguém conseguiria usar tanto assim, mas na prática havia usuários demais explorando criativamente os limites do serviço
      As contas ficavam ligadas em serviços 24/7 fazendo requisições até 95% do limite o tempo todo
      Usavam vários IPs e exibiam padrões que claramente não pareciam humanos
      No início, tratamos como outliers, mas quando esse tipo de conta começa a crescer exponencialmente
      na prática eram várias empresas criando múltiplas contas e fazendo balanceamento de carga entre elas
      Se você olha um gráfico médio de lucro/prejuízo por usuário, essas contas só geram perdas enormes enquanto consomem recursos no máximo
      Aí a política inevitavelmente muda
      Você perde esses “clientes”, mas a maioria dos usuários normais não é afetada
      E o serviço inteiro melhora
      Toda startup de alto volume acaba passando por isso

    • Na prática, a empresa pode estar vendendo esse serviço no prejuízo

    • Mesmo com os limites atuais, isso ainda não impediria esse tipo de abuso? Não entendo muito bem

    • Teve um cara se gabando disso no Twitter ontem
      Ele disse que usou US$ 13.200 com uma conta de US$ 200 e rodou 4 ou 5 agentes dedicados ao Opus 24/7 fazendo chamadas recursivas entre si
      Isso claramente é abuso e precisa ser alvo de restrição
      Mas não sei como exatamente um provedor de inference deveria bloquear isso
      O Cursor já está numa situação pior porque adiciona um prêmio maior em cima de Anthropc/OpenAI
      A Anthropic está numa situação parecida, mas sem uma opção premium aqui
      Se você permite, por US$ 20, até US$ 500 de custo real por mês, está basicamente dando 95% de desconto, e isso não tem como se sustentar
      Quando você subsidia assim, acaba criando um senso maior de “direito adquirido” na comunidade
      Parece que estão tirando algo a que as pessoas já se acostumaram, mas na prática o cap/opex sozinho já não fecha a conta, e se considerar também P&D, manter o modelo fica mais difícil ainda
      Então o que de fato resta é “continuar mudando a estrutura de preços enquanto os usuários vão migrando para a empresa que estiver subsidiando mais na próxima rodada”
      Teria sido melhor apresentar essas políticas desde o começo como um trial, deixando claro o tamanho do subsídio
      As pessoas experimentariam os modelos e algumas ficariam, e mesmo que houvesse alguma evasão, haveria menos ressentimento
      Se fossem realmente transparentes sobre a estrutura de cap/opex/custos de desenvolvimento
      as pessoas entenderiam que isso já está no nível de bancar “um engenheiro sênior incansável”

  • Este e-mail teria sido muito mais útil se trouxesse um histórico mensal mostrando em quais meses eu atingi o limite (Aug 2024, Jan 2025, May 2025 etc.)
    Eu não faço ideia se estou entre os 5%
    Na verdade, limitar 1% eu até entenderia, mas 5% em SaaS já representa uma parte enorme dos usuários reais

  • Esse tipo de serviço precisa de cobrança por medição
    Todas as empresas de IA estão batendo no mesmo problema
    Assinaturas de preço fixo existem porque a empresa quer que o usuário não pense no custo
    Só que uma minoria minúscula de power users força a assinatura até o limite extremo
    Serviços como Terragon foram criados justamente para otimizar esse tipo de uso
    Por isso a empresa continua reduzindo os limites, e o usuário passa a pensar ainda mais em custo
    O Cursor já ajustou os limites várias vezes, e agora a Anthropic está indo pelo mesmo caminho
    No fim, eles só não querem mais subsidiar os 10% de usuários mais extremos
    Eu queria que existisse um plano medido direto na interface web

    • A API existe, então dá para criar seus próprios tokens e usar o Claude Code diretamente sem nenhum plano separado

    • Isso me lembra a época da hospedagem compartilhada nos anos 1990

    • Se eles oferecerem um plano web medido, teriam que revelar o quão caro é de fato bancar inference
      Hoje ainda é extremamente caro rodar IA em um nível de uso produtivo real

  • A gente não consegue ter um bom serviço por causa desse “padrão avançado de uso do Claude em segundo plano 24/7”

    • As empresas de IA anunciam algo como “a IA toca o trabalho sozinha; o desenvolvedor pode tomar café ou dormir enquanto ela resolve tudo”, então de fato existem desenvolvedores usando o serviço exatamente desse jeito
      Agora culpar esses usuários como se fossem o problema é estranho

    • Eu ri nessa parte
      Parece coisa de um “destruidor benevolente de mundos” tentando acelerar ainda mais a morte térmica do universo

    • Acho que esse problema já era totalmente previsível
      Eles certamente consideraram isso o suficiente quando definiram o preço inicial
      Só não queriam que isso impedisse o lançamento, então a adoção foi adiada, e agora está sendo implementada em função da realidade

    • Não importa como você precifique, o usuário sempre vai tentar extrair 100% do plano dele
      Eu sou assinante Max e ainda assim bato no limite com frequência
      É estranho existir limite mesmo quando estou usando aquilo pelo que paguei

    • Isso é exatamente a lógica de experimento de preço
      Quando a regulação é fraca, em algum momento aparecem usuários extremos, e a empresa vende isso como se fosse sustentável, embora não seja, para depois retirar o bônus mais tarde

  • Talvez seja uma sugestão aleatória, mas pensei em limites adaptativos
    Opção 1: permitir rajadas intensas de uso por um período curto no começo e depois ir reduzindo gradualmente a velocidade, com possibilidade de nova rajada após um cooldown
    Assim o usuário consegue ter picos curtos de produtividade, e o servidor também consegue respirar
    Opção 2: como em dados móveis, você tem um volume de requisições que pode usar em alta velocidade e depois entra em throttling, com a opção de pagar por mais
    Esse modelo ainda gera receita adicional
    Opção 3: alocação adaptativa de recursos na infraestrutura e na rede
    Trabalhos que não dependem de GPU podem ter prioridade menor, requisições de rede podem ser processadas mais lentamente, ou o sistema pode distribuir as tarefas entre servidores diferentes em k8s conforme o consumo
    E, além de discutir limites, talvez fosse melhor rastrear quais requisições realmente gastam muito e ajustar caminhos de código ou a infraestrutura ineficiente para ganhar folga
    Vale reforçar que pequenas otimizações de código podem criar uma grande margem de respiro no sistema