Anthropic endurece limites de uso do Claude Code sem aviso prévio

(techcrunch.com)

5 pontos por GN⁺ 2025-07-18 | 2 comentários | Compartilhar no WhatsApp

Desde o início desta semana, a Anthropic passou a endurecer os limites de uso para usuários do Claude Code sem aviso prévio
As reclamações explodiram principalmente entre usuários intensivos do plano Max de US$ 200 por mês; ao atingir o limite, a única mensagem exibida é “Claude usage limit reached”, sem explicação detalhada
Como o limite foi reduzido sem aviso prévio nem anúncio de mudança, alguns usuários entenderam isso como um downgrade do plano de assinatura ou erro no rastreamento de uso
Sem explicação detalhada, a Anthropic afirmou oficialmente apenas que “alguns usuários estão enfrentando respostas lentas”, sem informar a causa exata nem um prazo de resolução
Sobrecarga de API e erros de rede também acompanharam o problema, ampliando as reclamações; os usuários agora pedem mais clareza sobre os limites e melhor comunicação, junto com uma queda na confiança

Endurecimento repentino dos limites de uso e confusão

Desde a última segunda-feira, os limites de uso do Claude Code foram repentinamente endurecidos, fazendo com que muitos usuários passassem a esbarrar nas restrições de forma inesperada
Só é exibida a mensagem “Claude usage limit reached”, junto de um aviso de que a limitação será removida após um certo período (algumas horas), mas sem qualquer detalhe sobre a mudança concreta nos limites
A desconfiança se intensificou especialmente entre assinantes de planos caros, como o Max de US$ 200, com suspeitas de erro no rastreamento de uso e confusão com possível downgrade de plano
Em páginas de issues no GitHub e outros espaços, cresceram as reclamações sobre a falta de transparência no cálculo do uso, com relatos como “fiz algumas solicitações em 30 minutos e já ultrapassei o limite de 900 mensagens”
Um usuário afirmou que “com esse limite é impossível tocar o projeto” e desabafou que “nem Gemini nem Kimi servem como substitutos”

Posição oficial e problemas de rede

A Anthropic disse apenas que “alguns usuários estão enfrentando respostas lentas”, evitando dar explicações adicionais
No mesmo período, ocorreram em série erros de sobrecarga da API e falhas de rede, enquanto a página oficial de status seguia mostrando 100% operacional, evidenciando inconsistência nas informações
A estrutura informal e variável em que limites e capacidade disponível são definidos de acordo com a demanda aumentou ainda mais a confusão

Estrutura complexa de preços e política de uso que provocaram a confusão

Os planos da Anthropic oferecem apenas limites por faixa e orientações, sem uma garantia clara de uso; tanto Free/Pro/Max trazem a indicação de que os limites “variam conforme a demanda”, o que gera confusão
- Plano Max: a comunicação oficial diz que oferece 20 vezes mais uso que o Pro, e o Pro oferece 5 vezes mais que o gratuito, mas os valores absolutos dos limites de uso não são divulgados
- Até o limite do plano gratuito é descrito como algo que “varia conforme a demanda”, ou seja, não há garantia absoluta de volume de uso
Como antes desse endurecimento alguns usuários conseguiam, na prática, usar o serviço em um nível equivalente a mais de mil dólares por dia em chamadas de API, já havia a percepção de que o plano Max era um modelo instável e difícil de sustentar no longo prazo
Por isso, o endurecimento em si não foi exatamente uma surpresa, mas os usuários apontam que o maior problema é a falta de transparência
- Um comentário representativo resume isso: “Comuniquem-se com transparência. A falta de comunicação destrói a confiança”

A essência do problema: comunicação e confiança

Alguns usuários dizem entender que os limites do plano Max talvez não fossem sustentáveis no longo prazo, mas reforçam a exigência de “apenas se comuniquem com transparência”
Mudanças sem aviso e orientações ambíguas levam à erosão da confiança dos usuários
Informações claras sobre limites, comunicação antecipada e resposta rápida a incidentes são fatores cruciais para manter o serviço e preservar a confiança dos clientes

2 comentários

princox 2025-07-22

Como é um produto na linha de frente da codificação agentiva, parece que o tráfego está se concentrando bastante por lá...

GN⁺ 2025-07-18

Comentários do Hacker News

Um usuário, pedindo anonimato, mencionou que não conseguiu mais continuar o projeto depois que surgiram as limitações de uso. Parece que ele atingiu o limite do vibe, e agora é hora de pensar por conta própria
- É verdade, mas a premissa fundamental que essas empresas vendem é que dá para terceirizar uma parte considerável do "pensar", e grande parte do investimento em IA também depende dessa premissa. Foi colocado tanto dinheiro nisso que é meio estranho sentir que o mercado continua o mesmo
- Acho que não vai parar em "pensar um pouco". Para continuar o projeto, vai ser preciso um nível muito mais profundo de reflexão, talvez até uma capacidade de raciocínio extrema
- Quem poderia ter previsto, de forma irônica, que depender fortemente de um serviço de terceiros com disponibilidade de longo prazo incerta poderia causar problemas? Parece uma volta à era dos compiladores pagos ou dos mainframes remotos, e as pessoas sempre repetem esse erro
- Tenho 99% de certeza de que esses usuários não são vibe coders que não sabem programar de verdade. Esse tipo de gente usaria ferramentas como lovable, não mexeria em ferramentas de terminal
- Entrei justamente para comentar sobre a mesma citação. É surpreendente que já tenhamos chegado a essa situação, mas ao mesmo tempo acho que não deveria ser surpresa
O Claude 4.0 não é necessariamente mais inteligente, em termos de inteligência bruta, do que outros modelos principais. Mas ele foi muito bem refinado para usar as ferramentas certas durante programação. Se os outros modelos alcançarem isso em breve, vai ser difícil manter limitações tão rígidas assim. Do ponto de vista do Google, por instalar o próprio silício e ainda otimizar tudo diretamente, ele está em uma posição vantajosa em termos de fluxo de caixa absoluto. Curiosamente, quase ninguém aqui nos comentários parece entender as leis de escala de compute. As pessoas têm na cabeça a ideia de que, como no modelo do Uber, o sistema em algum momento vai precisar aumentar os preços, mas IA não é trabalho humano. Com o tempo, o custo de computação tende a cair. Apostar agora mesmo tendo prejuízo no curto prazo é, na verdade, a estratégia com maior chance de sucesso, e não acho que isso seja burrice. A maioria das pessoas fica esperando ansiosamente o dia em que essa bolha vai estourar para posar de esperta dizendo "eu previ", mas no longo prazo essa direção continua sendo a correta
- Mesmo supondo que a lei de Moore continue valendo, isso só significa que o custo de compute cairia pela metade a cada 18 meses, assumindo que a eficiência no uso de recursos computacionais e a eficiência elétrica por cálculo não mudem. Houve um comentário dizendo que no plano de US$ 200 por mês o custo chegou a US$ 4.000; em termos de custo-eficiência, isso levaria 8 anos. Fico em dúvida se alguém está disposto a sustentar prejuízo por 8 anos
- Na prática, os modelos atuais também não são tão "inteligentes" quanto dizem. Estão longe de AGI. Gestão de contexto, separação de tarefas, retries, prevenção de loops infinitos, exposição adequada de ferramentas e coisas assim são mais importantes
- Eu não uso o plano de US$ 100 por mês; pago pelo preço da API e uso o Claude Code com muito cuidado. No primeiro dia ele entrou em loop, repetindo as mesmas duas soluções erradas, e só parou depois de queimar US$ 30. Desde então, gasto uns US$ 3 a US$ 5 por dia e consigo fazer muita coisa com eficiência. A Anthropic precisa encontrar formas de incentivar os desenvolvedores a usar o Claude Code com mais sabedoria. Se você não controla, ele realmente dispara e sai do controle
- O problema do modelo é que ele despeja uma quantidade enorme de conteúdo inútil. Quando a indústria é pequena, esse nível de poluição até passa, mas quando escala para o mundo inteiro, limpar isso depois não é nada trivial
- Claude também é bom, mas se a questão for "esperteza", a conversa muda. Pessoalmente, acho que os modelos medium 3 da Mistral e devstral medium também são subestimados. Nenhum dos dois é exatamente "esperto", mas quando você precisa de código útil para tarefas simples, o custo-benefício é realmente muito bom
Usei o Claude Code no plano básico de US$ 20/mês para um projeto paralelo. Não usei o tempo todo, mas o volume de chamadas foi suficiente. Achei que atingiria rápido o limite dos US$ 20, mas no fim não consegui chegar lá. Sinceramente, ainda precisei corrigir eu mesmo várias partes que a IA não conseguia fazer, ou escrever bastante código manualmente, mas o consumo de tokens me pareceu realmente generoso. Comparando com preços de API, parecia que eu estava usando algo como US$ 10 a US$ 20 em tokens por dia. Acho que por um tempo eles deixaram os limites bem folgados para ganhar usuários, e agora estão apertando porque não conseguem mais absorver a capacidade. Como a matéria diz, nem consigo imaginar quanto alguém precisa usar para passar do limite do plano de US$ 200/mês
- No Claude Code existem inúmeras formas de usar os tokens com mais eficiência. Faço uma previsão cautelosa de que em breve possa surgir um modelo específico para Claude Code. Pela minha experiência experimental, muito token foi desperdiçado em repetições sem sentido, como reler um script Python inteiro para checar o estado dos comentários, ou reler um script R apenas para verificar fechamento de colchetes. Se eliminarem só esse tipo de padrão ineficiente, já dá para economizar bastante recurso
- Hoje em dia esses limites mudam muito rápido, às vezes por semana ou até por dias, e também variam conforme horário, localização, data de criação da conta e assim por diante
- Eu atingi o limite no CC em uma hora com apenas um pedido. Nem era opus. Quando você usa um pouco mais, em algum momento aparece quase uma mensagem de aviso preventivo, mas dá a impressão de que eles não querem deixar o limite claro e preferem fazer upsell para planos mais altos
- O processo de Thinking costuma ser muito mais ineficiente do que um chat comum. Se usar bastante, dá para gastar centenas de dólares rapidamente
- Se você não consegue atingir o limite, talvez isso signifique que precisa escrever prompts mais criativos. Eu às vezes lanço um prompt e faço o sistema trabalhar sozinho por quase uma hora até atingir o limite. Dá para criar subagentes e rodá-los em paralelo, ou deixar tarefas totalmente automatizadas por muito tempo. Vale a pena pensar com uma perspectiva mais ampla do que só "faz isso aqui"
Se a Apple comprasse um MacBook M4 e, sem qualquer aviso, reduzisse o desempenho para o nível de um M1, a mídia de tecnologia e as entidades de defesa do consumidor ficariam em polvorosa. Mas as empresas de IA podem te vender acesso por US$ 100 e depois piorar o desempenho sem dizer nada, e fica tudo em silêncio. Fico me perguntando como isso é possível
- Do ponto de vista da empresa, a capacidade é limitada e eles querem fornecer um produto razoável para todos os usuários. Parece que definir e cumprir limites adequados foi algo muito difícil. Eles provavelmente estão tendo dificuldade para prever a capacidade real e o número de participantes. Ainda quase não há concorrentes e não existe um parâmetro especial de preço. Espero que isso melhore no futuro
Acho que este ainda não é o momento de ficar bravo, porque provavelmente eles estão operando no prejuízo. Com o Cursor é a mesma coisa: a política de preços também é opaca. Estou pagando o plano Max, mas pelo relatório da API já usei quase US$ 1.000. Também não sei quanto de cota ainda resta, e a informação de preço que a API mostra também não me parece fazer muito sentido
- Um colega meu afirma que queimou US$ 1.000 por semana neste mês. Considerando que, do ponto de vista da empresa, a assinatura custa só US$ 200 por mês, isso é realmente impressionante
- Nós acabamos de encerrar ontem nossa closed alpha e estamos pensando na política de preços ideal. Se puder dar feedback, eu realmente agradeceria: https://www.charlielabs.ai/pricing
- Fiquei curioso sobre qual ferramenta você está usando para verificar o preço. Queria perguntar se é o cursor-stats
- Não concordo com a ideia de que devemos ser compreensivos só porque a empresa está operando no prejuízo. Estou realmente cansado de produtos que tentam lançar sem um modelo de receita claro
Eu queria ver vídeos de ambientes de trabalho reais em que as pessoas atingem esses limites no dia a dia. Eu uso principalmente sonnet para programar, mas no plano de US$ 20/mês nunca consegui nem atingir o limite básico. Uso para escrever especificações, documentação, trabalho repetitivo com base em exemplos bem conhecidos e criação repetida de certos serviços. A menos que seja para reescrever o codebase inteiro, muitas vezes penso que, para mudanças pequenas, não é mais rápido simplesmente eu mesmo ajustar do que explicar o problema em inglês para a IA e entrar em um ciclo grande?
- Eu atinjo o limite com Opus e fluxos de trabalho longos. Mais especificamente, divido em dois grandes fluxos de trabalho, planejamento e implementação, e só com pesquisa de ideias e geração do documento de plano já gasto algo como US$ 10 a US$ 30 na API. Durante a revisão eu mesmo corrijo pequenos erros ou excessos, e na etapa seguinte também executo a implementação. A fase de implementação, aliás, tende a ser mais barata. Com base nesse documento de plano, faço até gerar automaticamente um GitHub PR. Para atingir o rate limit do plano Max de US$ 100, basta repetir esse ciclo 3 ou 4 vezes em 5 horas. Também dá para despejar instruções complexas no Opus, e a confiabilidade é bem alta. Se você usar o Code só como interação simples, quase nunca atinge isso. Quem parece furar esse limite com frequência são os vibe coders
- Quando chega o momento em que a IA não consegue convergir para a direção certa, no fim das contas é o ser humano que precisa concluir o trabalho
- Fiquei curioso se você está usando Claude Code com sonnet. Se usar só pela web, parece que o limite é enorme
- Nesta semana, mesmo com o plano Max, eu não consegui completar nem tarefas simples com sucesso. Não é um nível de sobrecarga que afeta só usuários Max. Parece que o rate limit aparece aleatoriamente a qualquer momento. Às vezes trava já no primeiro prompt
- No geral, fazer diretamente é mais rápido, mas eu trabalho indo e voltando entre várias tarefas driven by interrupts, então prefiro só mandar o prompt rapidamente e esperar enquanto ele roda em segundo plano. Mesmo que o agent leve 3 vezes mais tempo, o meu gasto de tempo termina em alguns segundos digitando o prompt
Há alguns dias, eu estava fazendo uma grande refatoração em dois projetos e, ao mesmo tempo, tocando trabalho de design em outros dois projetos. Quando fui checar o uso da API do Gemini, já tinha gasto US$ 200 em um único dia. Os usuários conseguem rodar isso com uma intensidade muito maior. Acho difícil uma empresa lucrar mantendo uma política de uso ilimitado por US$ 200/mês. Parece provável que no futuro surjam sistemas para distribuir o trabalho de forma inteligente considerando o custo. O openrouter parece estar caminhando nessa direção também, mas para fazer o roteamento correto vai ser necessário um volume enorme de contexto
Houve uma fala dizendo que, depois da limitação de uso, "o projeto realmente não anda". A pessoa disse que também testou Gemini, Kimi e outros, mas não encontrou nenhuma ferramenta com um conjunto de recursos tão amplo quanto o Claude Code. Considerou isso um caso de PMF
Comecei esta semana o plano de US$ 200/mês, mas antes já gastava mais de US$ 300 por mês em tokens de API. Eu também pensava: "como isso pode fechar a conta do ponto de vista da Anthropic?". Mas continuei recebendo erros de sobrecarga da API, então acabei cancelando o plano e voltando para os tokens da API. Não faço ideia de qual é a intenção dessa política, mas eu estaria disposto a pagar para usar. Em vez de só estampar "US$ 200/mês", eu gostaria que garantissem acesso de verdade
- Fiquei curioso se você teve essa experiência com Opus. Também queria saber que tipo de trabalho estava fazendo. Eu só cheguei a gastar uma montanha de tokens quando trabalhei com um arquivo-fonte grande de 2,5 MB. Fora isso, nem consigo usar todo o plano de 100 EUR. Uso principalmente Opus
- Também existe a suspeita de que o preço da API já esteja muito acima do custo real. Eu só coloquei US$ 5 para brincar e testar, e aquilo rodou computação por uns 30 minutos, o que na prática equivaleu a algo como 3 horas de experiência. Convertendo grosseiramente, isso dá uns US$ 10 por hora, ou US$ 90 mil por ano. Ainda não estou convencido de que comprar e operar GPUs custe mesmo US$ 90 mil por ano. Ainda não consigo achar que o custo de infraestrutura de GPU já tenha passado do nível de investimento em hardware
Não dá para distinguir se a qualidade do serviço piorou de propósito ou se a demanda cresceu rápido demais para os servidores suportarem e, como medida temporária, eles reduziram os limites. Se a demanda continuar aumentando, essas restrições podem acabar ficando permanentemente mais severas. Não acredito que a Anthropic esteja tentando justamente agora otimizar COGS. Eles têm a oportunidade de conquistar todo o mercado de DevTools, têm muito caixa e forte disposição para investir, então enfraquecer o poder do produto me parece uma visão de curto prazo
- Muita gente abandonou o Cursor muito rapidamente. Trocar de IDE já é uma grande coisa para mim, então eu nem cheguei a testar o Cursor. O Claude Code é um conceito muito melhor e não precisa necessariamente estar ligado a uma IDE. Por isso, a migração para concorrentes é até mais fácil. Nesse sentido, as características do modelo por trás do Claude Code também trazem o risco de que ganhar participação de mercado acabe perdendo o sentido.