Assinaturas de IA são uma bomba-relógio para as empresas

(thestateofbrand.com)

7 pontos por GN⁺ 2026-05-18 | 7 comentários | Compartilhar no WhatsApp

OpenAI, Anthropic, Google e outras oferecem às empresas preços de assinatura abaixo do custo real de entrega, o que pode gerar um grande choque de custos quando houver reajuste de preços
A mensalidade fixa de US$ 20 do Claude Pro e do ChatGPT Plus pode corresponder, para usuários intensivos, a um custo real equivalente de API de US$ 200 a US$ 400 por mês por assento
A IA agente aumenta muito o consumo de tokens com execuções autônomas de longa duração, e o GitHub Copilot também migrará para cobrança baseada em uso em junho de 2026
O custo mensal de assinatura de US$ 1.000 para uma equipe de 50 pessoas pode equivaler, com base no consumo real de tokens, a US$ 15.000 a US$ 40.000 por mês, ampliando a exposição orçamentária
A preparação de OpenAI e Anthropic para IPO aumenta a pressão por margens e economia unitária, podendo acelerar aumentos de preço, limites de uso e a migração para cobrança baseada em consumo

A diferença entre o preço das assinaturas de IA e o custo real

Grandes provedores de IA como OpenAI, Anthropic e Google estão oferecendo serviços a clientes corporativos com preços de assinatura abaixo do custo real de entrega, e se as empresas tratarem esse preço como referência permanente e estruturarem seus fluxos de trabalho em torno disso, poderão sofrer um forte choque de custos quando os preços forem ajustados no futuro
O Claude Pro oferece Sonnet 4.6, Opus 4.6, busca na web, execução de código, geração de arquivos e cerca de 5 vezes mais uso que o plano gratuito por US$ 20 por mês
Pela tabela de API, o Sonnet 4.6 custa US$ 3 por 1 milhão de tokens de entrada e US$ 15 por 1 milhão de tokens de saída, enquanto o Opus 4.6 custa US$ 5 por 1 milhão de tokens de entrada e US$ 25 por 1 milhão de tokens de saída
Se um profissional do conhecimento usa Claude por algumas horas todos os dias, faz upload de documentos e executa redação de relatórios e análise de dados, pode consumir milhões de tokens por semana; convertido para a precificação de API, isso pode chegar a US$ 200 a US$ 400 por mês por assento
Foi reportado que a Microsoft teve prejuízo superior a US$ 20 por usuário por mês com o GitHub Copilot, e que o custo de computação de usuários intensivos com assinatura de US$ 10 por mês chegou a US$ 80
Há análises indicando que usuários da Anthropic consumiram mais de US$ 8 em computação para cada US$ 1 de receita de assinatura, e Nick Turley, VP de produto da OpenAI, descreveu a estrutura de preços de assinatura como algo que se consolidou por acaso e comparou a possível eliminação gradual de planos ilimitados ao uso ilimitado de eletricidade
O ChatGPT Plus manteve o preço de US$ 20 por mês por 3 anos, mas nesse período ganhou recursos como geração de imagens, interpretação de código, modo de voz, raciocínio agente e busca na web

A estratégia de preços comum entre os principais provedores

O Google oferece o Gemini Advanced incluído no Google One AI Premium de US$ 20 por mês, enquanto cobra separadamente pelo acesso via API ao mesmo modelo
A Meta oferece o Llama gratuitamente e subsidia com receita de publicidade o custo computacional de centenas de milhões de consultas de IA geradas em sua própria plataforma
O Grok, da xAI, definiu o preço de entrada da API em apenas US$ 0,20 por 1 milhão de tokens, e é tratado como uma estrutura que aceita prejuízo para ganhar participação de mercado
O padrão comum é definir preços com foco na expansão da adoção, e não na eficiência econômica, prender as organizações à plataforma e tornar a IA um elemento central de dependência no trabalho diário de cada equipe, deixando a questão do custo para depois
Foi reportado que a OpenAI tem prejuízo com assinantes consumidores e estaria considerando mudar a estratégia para focar mais no segmento enterprise, onde a economia unitária é relativamente menos ruim
Segundo o The Wall Street Journal, a OpenAI ficou aquém de metas importantes de receita e usuários no caminho para o IPO, e o sistema de preços baseado em subsídios também começa a mostrar rachaduras

A IA agente piora a estrutura de custos

No uso de chatbots, perguntas e respostas geravam um consumo de tokens relativamente previsível, mas a IA agente aumenta fortemente o uso de tokens com execuções autônomas de longa duração
Sessões do Claude Code podem rodar autonomamente por longos períodos e consumir tokens em um ritmo muito maior que o uso interativo
Alguns usuários relataram ter esgotado a janela de limite de 5 horas em apenas 90 minutos
O GitHub anunciou que, como o modelo de tarifa fixa entrou em colapso diante de cargas de trabalho agenticas, levará o Copilot para cobrança baseada em uso a partir de 1º de junho de 2026
O GitHub afirmou que o Copilot evoluiu muito e que o uso agente "está se tornando o padrão", o que eleva as exigências de computação e inferência
Sam Altman disse publicamente que a OpenAI agora precisa se tornar uma empresa de inferência de IA, o que se conecta ao contexto de que o uso agente exige um modelo econômico fundamentalmente diferente
Nas equipes de engenharia, os Agent Teams, em que múltiplas instâncias de IA trabalham em paralelo no mesmo projeto, ampliam drasticamente o consumo de custos; se um desenvolvedor roda 3 ou 4 agentes de programação ao mesmo tempo, o uso de tokens pode crescer não apenas algumas vezes, mas mais de uma ordem de grandeza em relação a uma conversa simples

A exposição de custo que as empresas não estão medindo

Nos últimos 2 anos, muitas empresas integraram assinaturas de IA profundamente à operação: marketing escreve textos com ChatGPT Plus, engenharia usa Claude Pro para escrever e revisar código, e equipes de pesquisa, sucesso do cliente e finanças também usam IA para resumo de documentos, tickets e modelagem de cenários
Se 50 pessoas usam Claude Pro, o custo atual é de US$ 1.000 por mês, e com o ChatGPT Plus o valor é semelhante, fazendo a IA parecer uma linha pequena no demonstrativo de resultados
Mas, se o uso real de API da mesma equipe for calculado com base no consumo de tokens, o custo pode chegar a US$ 15.000 a US$ 40.000 por mês, dependendo da intensidade de uso, transformando-se em uma despesa que exige um centro de custo próprio
Quando o preço for reajustado, empresas que enxergavam a IA de US$ 20 por mês como um insumo permanentemente barato podem acabar recebendo uma cobrança não prevista justamente quando a ferramenta já estiver tão incorporada ao fluxo de trabalho que será difícil removê-la
O subsídio cria dependência, e a dependência vira uma armadilha corporativa que dificulta evitar aumentos de preço
O Q1 2026 AI Quarterly Pulse da KPMG estima que organizações nos EUA esperam gastar em média US$ 207 milhões com IA nos próximos 12 meses, quase o dobro em relação ao mesmo período do ano anterior
Segundo uma pesquisa do Goldman Sachs, muitas grandes empresas já estão ultrapassando seus orçamentos de IA em vários dígitos, e os gastos com IA podem se aproximar dos salários de engenheiros em um futuro próximo
Swami Chandrasekaran, líder do laboratório de IA e dados da KPMG North America, disse à Marketplace que até apenas um ou dois trimestres atrás ninguém se preocupava com o custo de consumo de LLMs
O economista Brian Jabarian, da University of Chicago, ao aconselhar empresas em transformações com IA, disse que a hora da conta chegar está se aproximando

O IPO pode forçar uma reprecificação

OpenAI e Anthropic estão se preparando para IPO, e nesse processo pode aumentar a pressão para reduzir a diferença entre o preço da assinatura e o custo real
Foi reportado que a Anthropic ultrapassou US$ 30 bilhões em receita anualizada, acima dos US$ 9 bilhões no fim de 2025
A OpenAI é retratada como operando a um ritmo de receita de cerca de US$ 25 bilhões
A OpenAI projeta consumo acumulado de caixa de US$ 115 bilhões até 2029 e é apresentada como tendo prometido US$ 665 bilhões em gastos com computação até 2030
A Oracle é apresentada como tendo assumido US$ 43 bilhões em dívida em um ano fiscal para construir data centers para a OpenAI
Enquanto continuam privadas e queimando capital de risco, essas empresas podem subsidiar o custo de inferência, operar modelos no prejuízo e manter planos de US$ 20 por mês cujo custo de entrega supera US$ 100
Depois do IPO, o mercado público passará a exigir margens, analistas vão cobrar economia unitária, e investidores vão querer um caminho para rentabilidade que não dependa de captação infinita
As formas mais rápidas de reduzir essa diferença de preço são aumento de preço, limitação de uso e transição para cobrança baseada em consumo; as três podem afetar fortemente os assinantes corporativos atuais

Sinais de reprecificação já estão aparecendo

O GitHub está migrando para cobrança baseada em uso em 1º de junho de 2026 e substituirá solicitações premium de tarifa fixa por AI Credits baseados em tokens
A Microsoft aumentou o preço do Microsoft 365 duas vezes em 4 anos, e o reajuste mais recente está diretamente ligado aos custos de infraestrutura de IA
A OpenAI introduziu um novo nível de preço real para usuários intensivos, com o plano Pro de US$ 100
O plano Max de US$ 200 por mês da Anthropic é um exemplo de quanto o uso comprometido pode realmente custar quando os subsídios terminarem
Geoff Webb, VP da Conga, disse que a escala da corrida pela liderança no mercado de IA é gigantesca, e como o custo para dominá-la também é enorme, há grande chance de mudanças rápidas no modelo de negócios e no preço dos serviços durante o processo de monetização e retorno sobre investimento

O que líderes empresariais devem fazer agora

Empresas devem auditar o consumo real de tokens por equipe, em vez de apenas contar assentos
É preciso modelar como os custos de IA mudariam em cenários de 2x, 5x e 10x em relação ao preço atual
É preciso criar opcionalidade de fornecedores na stack para que uma mudança de preço de um único provedor não destrua de repente o orçamento
A lacuna de custos da IA deve ser discutida com o CFO antes que o próprio CFO levante o problema
A diferença entre o que a organização paga hoje por IA e o que poderá pagar daqui a 18 meses pode se tornar um dos maiores aumentos de despesa que muitas empresas terão de absorver
Pode haver empresas que precisarão explicar por que uma ferramenta que antes custava menos que o almoço da equipe passou a exigir um orçamento anual de seis dígitos
A era dos subsídios está acabando, e muitas empresas ainda nem começaram essa conversa

7 comentários

hmmhmmhm 29 일 전

Parece a mesma questão da época dos mainframes..
Se a configuração for de que servidores são caros e os recursos são escassos, enquanto os computadores pessoais são lentos,
no fim os servidores também ficam baratos e os computadores pessoais também ganham desempenho... acho que o tempo vai resolver.

GN⁺ 2026-05-18

Comentários do Hacker News

Toda assinatura de IA parece uma bomba-relógio para os provedores de modelos de fronteira
Em alguns anos, vai ser possível rodar modelos locais tão bons quanto os modelos de fronteira de hoje com custo quase zero, e a base do mercado corporativo das empresas de fronteira vai ruir
- Não sei em que se baseia a afirmação de que “em alguns anos vamos rodar modelos locais tão bons quanto os modelos de fronteira de hoje”
  Só os requisitos de memória já são enormes, e por um bom tempo ainda vai ser muito mais eficiente em termos de custo usar hardware dedicado compartilhado com alta taxa de utilização
- Em outras palavras, modelos de fronteira são ativos que perdem valor muito rápido por causa da concorrência de mercado
  Como precisam continuar melhorando para ficar à frente uns dos outros e dos modelos com pesos abertos, isso está mais para o oposto de uma bomba-relógio
  Os tokens de inferência no nível atual vão continuar ficando mais baratos, e não sei se o estado final será local, porque as exigências de hardware são altas, mas a concorrência tende a empurrar as margens de lucro para perto de zero
  Discussão longa sobre esse tema: https://corecursive.com/the-pre-training-wall-and-the-treadm...
- No último mês, conectei Qwen, Gemma e Deepseek por trás do LiteLLM e fiz uma pequena demo mostrando como o futuro pode ser
  Estou monitorando o uso de tokens e me movendo ativamente para reduzir o custo de inferência e internalizar isso, em vez de simplesmente gastar muitos tokens de forma bruta
  Meu chefe ficou muito satisfeito e agora estamos implantando isso de forma mais ampla. Acho que esse é o futuro
- A ideia de que em alguns anos vamos rodar modelos locais tão bons quanto os modelos de fronteira de hoje é muito duvidosa
  As leis de escala já ficaram pesadas, e não dá para cair nesse exagero do “exponencial”
  Além disso, o concorrente real são os modelos de fronteira de daqui a 2 anos
- A menos que haja avanços importantes na produção de hardware ou na arquitetura dos modelos, é mais o contrário
  Hoje é preciso hardware maior, mais caro e que consome mais energia do que há 1 ou 2 anos
O tom exagerado dos textos dos dois lados da IA é muito cansativo
Queria ficar na frente de um quadro branco com alguém que realmente entende de economia e do negócio dos provedores de tokens e perguntar “como se eu tivesse cinco anos”
Queria entender se para o provedor de tokens isso é um jogo de margem e para o consumidor é um jogo de qualidade de serviço/produto, se a linha entre qualidade e margem cruza em algum momento e, se cruza, se isso é uma corrida para chegar lá antes que o dinheiro acabe, e se há casos históricos em que a diferença entre os dois era tão grande
Os LLMs parecem únicos porque praticamente não há limite para o quanto o consumidor “espera que melhorem”, e isso é diferente de serviços como e-mail, que são fáceis de escalar do ponto de vista de recursos computacionais
É uma pergunta bem de iniciante, mas também fico curioso por que eles querem fazer IPO antes de existir um modelo de negócio sustentável. Qual é a vantagem?
- Perguntei para a IA qual é o custo de produção de tokens do Opus, e ela respondeu US$ 0,216 por milhão de tokens, incluindo hardware, eletricidade, refrigeração e hospedagem
  Pelos links compartilhados aqui, cerca de 30% dos gastos da Anthropic vão para inferência, e os outros 70% para P&D, como o desenvolvimento do próximo modelo
  Refletindo isso e adicionando lucro, se simplificar os números, bastaria vender a cerca de US$ 1 por milhão de tokens para ganhar dinheiro
  Hoje o preço da API é US$ 25 por milhão de tokens, então não tenho dúvida de que há lucratividade
  Já o plano Max de US$ 200 por mês, se usado ao extremo, pode chegar a 10 bilhões de tokens por mês, o que dá US$ 0,02 por milhão de tokens, ou seja, um prejuízo enorme, e isso vai desaparecer em algum momento
  Ainda assim, se alguém usa 100 milhões de tokens por mês no plano Anthropic de US$ 100 por mês, a empresa está ganhando dinheiro
  Para usar 10 bilhões de tokens por mês, a pessoa precisaria trabalhar por muito tempo e ser realmente muito boa em usar IA, e alguém assim provavelmente já usa IA há anos e já tirava proveito dela antes do Opus
  Vai se decepcionar se perder o Opus, mas esse tipo de usuário é justamente o tipo que também consegue aproveitar bem modelos menos fortes, então em alguns anos talvez migre para um modelo open source hospedado internamente e ainda consiga algo no nível atual de US$ 0,02 por milhão de tokens
  Por isso, não me convence o clima pessimista do texto. A situação vai mudar, mas isso não significa o fim do uso de IA
Concordo com o sentimento do texto, mas o estilo parece muito escrito por LLM
Especialmente a estrutura das seções e frases de efeito como “That is not a rounding error. That is a line item that needs its own budget code.”
- O Claude gera esse tipo de frase o tempo todo
  Isso é bem irritante, e com o mesmo prompt quase não vejo isso no Gemini
- Nem sei quem escreveu esse texto para começo de conversa
  Não tem nome de autor no artigo
- O Pangram marcou esse texto com alta confiança como 100% gerado por IA
Brad Gerstner confirmou que os tokens não estão sendo vendidos no prejuízo
Independentemente de como separem API e assinatura na fórmula, as empresas estão lucrando na venda pura de tokens
Se incluir salários e remuneração em ações, pode haver prejuízo, mas os tokens em si já são lucrativos hoje
- É como ver um foguete com o motor mais potente da Terra desligar os motores depois de sair da órbita e dizer “está voando sem propulsão”
  Pode até estar agora, mas não foi assim que chegou até aqui
  O investimento a recuperar é de trilhões de dólares e a receita é, no máximo, de dezenas de bilhões, então essa conta de que os tokens vão dar lucro no curto prazo não fecha
- Os tokens podem ser vendidos com lucro, mas 70% do gasto computacional vai para P&D e treinamento de modelos[0]
  A inferência não precisa apenas ser lucrativa isoladamente; ela também precisa bancar esse custo
  [0] https://epoch.ai/data-insights/openai-compute-spend
- Não estão vendendo no prejuízo, mas também não estão cobrando caro o suficiente para cobrir as perdas e os custos atuais
  Os prejuízos estão sendo empurrados para frente dentro de uma estrutura estranha de financiamento circular, e isso provavelmente vai ruir algum dia em uma crise de dívida
- Em outras palavras, as empresas de IA têm lucro positivo antes de descontar os custos
- Não sei se isso também vale para tokens do Claude Code ou do Codex
  Acho que esses estão recebendo um subsídio pesado, mas são os únicos em que realmente sinto valor
O problema da “IA” como um todo é que é fácil viver sem ela
As empresas de IA sabem disso, os usuários sabem disso, e até o gestor mais favorável a agentes de IA sabe disso
Se você imaginar remover toda a IA do mundo agora, o resultado seria só o trabalho normal de sempre
O texto não enfatiza isso o suficiente. É para ficar com medo do dia em que a revisão de PR vai ter de voltar para um engenheiro de verdade?
- Acho que isso sempre acontece no começo da adoção de uma nova tecnologia
  À medida que a tecnologia se integra mais profundamente, isso vai deixando de ser verdade
  Daria para dizer o mesmo alguns anos depois do surgimento do motor elétrico: bastaria voltar ao vapor
  Mas hoje, tentar viver sem motor elétrico faria a sociedade entrar em colapso
  A pergunta não é se dá para viver sem isso agora, e sim se ainda vai dar para viver sem isso daqui a 5 a 10 anos, quando estiver totalmente integrado
- Talvez por isso estejam forçando tanto
  Não para gerar receita honesta, mas para enfiar produtos de IA tão fundo que “vamos simplesmente tirar a IA” nem pareça mais uma opção
  Mesmo que o custo de manutenção continue subindo até ultrapassar o nível de resgate estatal estilo companhia aérea
  É uma nova camada intermediária de extração de riqueza vendida com promessas falsas
- Quem usa JavaScript obviamente vai pensar assim
  Pelo menos para escrever JavaScript, eu não consigo mais viver sem IA
- Sempre acho estranho quando recomendam usar ferramentas de IA até para tarefas totalmente comuns e genéricas
  Dá a impressão de que tratam isso como um bichinho de estimação que morre se você não der atenção de vez em quando
O texto está errado. Não é que esse tipo de assinatura não seja oferecido a empresas
As empresas pagam valores muito mais próximos dos preços de API
A estratégia é acostumar as pessoas com tokens ilimitados nas assinaturas individuais e esperar que esse comportamento migre para o trabalho
- É oferecido, sim
  Assentos de equipe ou enterprise são mais caros do que os preços para consumidor, mas têm preço fixo com limites de uso que se renovam
  Você pode atribuir aos membros assentos equivalentes aos planos de US$ 20/100/200 por mês, ou fazer tudo por uso medido
  Existem várias formas de comprar
- Assinaturas corporativas definitivamente são oferecidas
  Também existem planos pay-as-you-go correspondentes aos planos equivalentes de consumidor
- Fiquei confuso sobre por que estavam falando de assinatura para empresa
  Na minha empresa, a cobrança é pelo uso de API
- Quando vejo parágrafos assim, parece ainda mais um texto cuspido por IA
  “No geral, o padrão é o mesmo. Precificação para adoção, não para economia. Prende as organizações. Torna a IA uma parte estrutural do trabalho diário de todas as equipes. A conta fica para depois.”
- Além disso, a escala das tarifas de API de que o texto faz tanto escândalo ainda é relativamente pequena
  US$ 10 mil por mês não é nada, mas se esse dinheiro sustenta uma equipe de 10 a 20 engenheiros, é uma alavancagem bem interessante
Não li o texto original até o fim, mas deu para perceber que foi escrito por IA
Talvez o OpenRouter possa servir como referência para o custo de fornecimento de IA
Fico ouvindo o tempo todo que ele tem melhor custo-benefício do que o Claude, e se for verdade isso parece indicar que a Anthropic ou é particularmente ineficiente ou está lucrando com inferência
Podem perder dinheiro no treinamento, mas isso talvez seja só o custo de continuar sendo um laboratório de ponta
Se uma empresa específica quebrar por dívida ou algo assim, as empresas não poderiam simplesmente trocar de fornecedor?
Se eu vir mais uma vez frases como “It’s not X. It’s Y.” ou o uso metafórico de “load-bearing”, vou vomitar
- Já vi saírem muitas dessas expressões, e a lista não é curta
  “A era dos subsídios não está terminando com elegância. Está começando a rachar em toda parte.”
  “A pergunta não é se foi um bom negócio. É por quanto tempo esse negócio aguenta.”
  “Um desenvolvedor rodando três ou quatro agentes de codificação ao mesmo tempo não usa 3x ou 4x os tokens de uma conversa em chat. Usa não uma ordem de grandeza, mas mais de uma ordem de grandeza.”
  “Isso não são mais experimentos. São fluxos de trabalho estruturais.”
  “Isso não é erro de arredondamento. É um item que precisa do próprio código orçamentário.”
- Quando vier um grande reajuste de preços, muita gente que gerava comentários para redes sociais com assinatura gratuita ou de US$ 20 por mês talvez veja o custo real e volte a escrever por conta própria
  Pelo menos dá para torcer por isso
- Também odeio quando usam “the unlock” desse jeito
- O texto até começou bem
  Tinha dados e a lógica parecia plausível, mas ali pela metade começaram a aparecer exemplo de tendência, depois outro exemplo, depois um terceiro, e aí veio o “isso não é simplesmente X, é Y”
  É tão irritante quanto estar lendo um texto bem escrito, clicar no link da fonte e tomar um rickroll
Cliente enterprise não usa assinatura Claude Pro de US$ 20 por mês
Na nossa empresa, damos aos desenvolvedores um limite de uso de cerca de US$ 1 mil por mês, e pelo que vejo a economia em relação ao custo de API é de no máximo uns 30%
Não é um nível de subsídio maluco
Em muitos outros cargos, o permitido é só US$ 50 por mês, e essas pessoas continuam batendo no limite
O GitHub Copilot vem usando esse modelo em assentos business e enterprise, mas vai esbarrar no limite em breve
Acho que, depois de junho, quando reorganizarem as contas Pro e Pro+ de consumidor, isso vai acompanhar rapidamente
Parece que a OpenAI está distribuindo tokens para prender clientes, então minha maior preocupação são mudanças bruscas de preço e termos do lado da OpenAI depois do IPO
A Anthropic já está agindo com responsabilidade nessa parte, e o GitHub Copilot também parece estar tentando corrigir os subsídios excessivos nos próximos meses
- Só o GitHub Copilot dava um subsídio realmente absurdo
  Porque cobrava por “requisição”, não por token
  Uma única requisição de 3 centavos podia queimar mais de US$ 20 em tokens, e esse modelo acaba neste mês
  Eu também estava preocupado porque vinha processando grandes blocos de trabalho com o GHCP, mas o novo estimador de cobrança mostrou algo na faixa de US$ 150 a 200 por mês com base em preços de API
  Ainda é subsídio para uma assinatura de US$ 20 por mês, mas não em um nível insano
  Se você usar bastante ferramentas de codificação em estilo agente de forma responsável, provavelmente vai cair em algo perto de US$ 200 por mês com preços de API
  Se o provedor ainda ganha dinheiro nesse preço, então para uma empresa no Ocidente que contrata desenvolvedores, isso não é difícil de aceitar quando se considera o tempo economizado
  O risco real está para os vibe coders em projetos pessoais
  A era de abusar de planos subsidiados para criar apps gigantes está acabando
Se for substituir desenvolvedores, faz sentido custar mais do que US$ 20 ou US$ 100 por mês
O problema real das empresas de LLM é que elas ainda não mostraram valor fora da programação
Sem isso, vão acabar reduzidas a ferramentas de coding
É por isso que estão correndo agora, e a chave é que outros fluxos de trabalho conseguem automatizar
Talvez consigam automatizar todo o trabalho burocrático
Se outras áreas se desenvolverem, vão mudar o modelo de preços
- Também estão tentando, até certo ponto, substituir o Figma
  Isso pode ter valor sim

taekim34 29 일 전

Para economizar tokens, é importante verificar em tempo real "quanto estou usando agora". Em especial, como a cobrança baseada em tokens, ao contrário da assinatura, pode disparar de forma não linear dependendo do padrão de uso, é preciso conseguir ver no nível da sessão onde os custos estão vazando para poder reagir. Se você usa o ambiente Claude Code, experimente o cc-token-saver (https://github.com/ww-w-ai/cc-token-saver). Ele mostra em tempo real os custos por sessão e por intervalo, bloqueia automaticamente reenvios caros quando o cache expira e ainda delega automaticamente tarefas pesadas para um SubTask de baixo custo.

iolothebard 29 일 전

No fim das contas, a gente acaba usando.
iPhone 3 custava uns 200~300 dólares… hoje já passa fácil de 1.000, mas a gente continua usando. Já provou o gostinho.

prunusnira 29 일 전

Parece que a adoção de LLMs locais vai aumentar cada vez mais.

master6559 2026-05-18

Se for caro, é só não usar..

aer0700 29 일 전

Como presumem que, mesmo caro, as empresas vão pagar, os provedores de LLM devem estar aumentando os preços. Fico curioso para ver como vão evoluir LLMs open source como GLM, qwen e deepseek daqui para frente. As pessoas vão começar a fazer as contas: vale pagar esse preço para usar modelos de fronteira ou, mesmo com o trabalho de implementar uma infraestrutura própria com vLLM, faz mais sentido usar open source?