Assinaturas de IA são uma bomba-relógio para as empresas
(thestateofbrand.com)- OpenAI, Anthropic, Google e outras oferecem às empresas preços de assinatura abaixo do custo real de entrega, o que pode gerar um grande choque de custos quando houver reajuste de preços
- A mensalidade fixa de US$ 20 do Claude Pro e do ChatGPT Plus pode corresponder, para usuários intensivos, a um custo real equivalente de API de US$ 200 a US$ 400 por mês por assento
- A IA agente aumenta muito o consumo de tokens com execuções autônomas de longa duração, e o GitHub Copilot também migrará para cobrança baseada em uso em junho de 2026
- O custo mensal de assinatura de US$ 1.000 para uma equipe de 50 pessoas pode equivaler, com base no consumo real de tokens, a US$ 15.000 a US$ 40.000 por mês, ampliando a exposição orçamentária
- A preparação de OpenAI e Anthropic para IPO aumenta a pressão por margens e economia unitária, podendo acelerar aumentos de preço, limites de uso e a migração para cobrança baseada em consumo
A diferença entre o preço das assinaturas de IA e o custo real
- Grandes provedores de IA como OpenAI, Anthropic e Google estão oferecendo serviços a clientes corporativos com preços de assinatura abaixo do custo real de entrega, e se as empresas tratarem esse preço como referência permanente e estruturarem seus fluxos de trabalho em torno disso, poderão sofrer um forte choque de custos quando os preços forem ajustados no futuro
- O Claude Pro oferece Sonnet 4.6, Opus 4.6, busca na web, execução de código, geração de arquivos e cerca de 5 vezes mais uso que o plano gratuito por US$ 20 por mês
- Pela tabela de API, o Sonnet 4.6 custa US$ 3 por 1 milhão de tokens de entrada e US$ 15 por 1 milhão de tokens de saída, enquanto o Opus 4.6 custa US$ 5 por 1 milhão de tokens de entrada e US$ 25 por 1 milhão de tokens de saída
- Se um profissional do conhecimento usa Claude por algumas horas todos os dias, faz upload de documentos e executa redação de relatórios e análise de dados, pode consumir milhões de tokens por semana; convertido para a precificação de API, isso pode chegar a US$ 200 a US$ 400 por mês por assento
- Foi reportado que a Microsoft teve prejuízo superior a US$ 20 por usuário por mês com o GitHub Copilot, e que o custo de computação de usuários intensivos com assinatura de US$ 10 por mês chegou a US$ 80
- Há análises indicando que usuários da Anthropic consumiram mais de US$ 8 em computação para cada US$ 1 de receita de assinatura, e Nick Turley, VP de produto da OpenAI, descreveu a estrutura de preços de assinatura como algo que se consolidou por acaso e comparou a possível eliminação gradual de planos ilimitados ao uso ilimitado de eletricidade
- O ChatGPT Plus manteve o preço de US$ 20 por mês por 3 anos, mas nesse período ganhou recursos como geração de imagens, interpretação de código, modo de voz, raciocínio agente e busca na web
A estratégia de preços comum entre os principais provedores
- O Google oferece o Gemini Advanced incluído no Google One AI Premium de US$ 20 por mês, enquanto cobra separadamente pelo acesso via API ao mesmo modelo
- A Meta oferece o Llama gratuitamente e subsidia com receita de publicidade o custo computacional de centenas de milhões de consultas de IA geradas em sua própria plataforma
- O Grok, da xAI, definiu o preço de entrada da API em apenas US$ 0,20 por 1 milhão de tokens, e é tratado como uma estrutura que aceita prejuízo para ganhar participação de mercado
- O padrão comum é definir preços com foco na expansão da adoção, e não na eficiência econômica, prender as organizações à plataforma e tornar a IA um elemento central de dependência no trabalho diário de cada equipe, deixando a questão do custo para depois
- Foi reportado que a OpenAI tem prejuízo com assinantes consumidores e estaria considerando mudar a estratégia para focar mais no segmento enterprise, onde a economia unitária é relativamente menos ruim
- Segundo o The Wall Street Journal, a OpenAI ficou aquém de metas importantes de receita e usuários no caminho para o IPO, e o sistema de preços baseado em subsídios também começa a mostrar rachaduras
A IA agente piora a estrutura de custos
- No uso de chatbots, perguntas e respostas geravam um consumo de tokens relativamente previsível, mas a IA agente aumenta fortemente o uso de tokens com execuções autônomas de longa duração
- Sessões do Claude Code podem rodar autonomamente por longos períodos e consumir tokens em um ritmo muito maior que o uso interativo
- Alguns usuários relataram ter esgotado a janela de limite de 5 horas em apenas 90 minutos
- O GitHub anunciou que, como o modelo de tarifa fixa entrou em colapso diante de cargas de trabalho agenticas, levará o Copilot para cobrança baseada em uso a partir de 1º de junho de 2026
- O GitHub afirmou que o Copilot evoluiu muito e que o uso agente "está se tornando o padrão", o que eleva as exigências de computação e inferência
- Sam Altman disse publicamente que a OpenAI agora precisa se tornar uma empresa de inferência de IA, o que se conecta ao contexto de que o uso agente exige um modelo econômico fundamentalmente diferente
- Nas equipes de engenharia, os Agent Teams, em que múltiplas instâncias de IA trabalham em paralelo no mesmo projeto, ampliam drasticamente o consumo de custos; se um desenvolvedor roda 3 ou 4 agentes de programação ao mesmo tempo, o uso de tokens pode crescer não apenas algumas vezes, mas mais de uma ordem de grandeza em relação a uma conversa simples
A exposição de custo que as empresas não estão medindo
- Nos últimos 2 anos, muitas empresas integraram assinaturas de IA profundamente à operação: marketing escreve textos com ChatGPT Plus, engenharia usa Claude Pro para escrever e revisar código, e equipes de pesquisa, sucesso do cliente e finanças também usam IA para resumo de documentos, tickets e modelagem de cenários
- Se 50 pessoas usam Claude Pro, o custo atual é de US$ 1.000 por mês, e com o ChatGPT Plus o valor é semelhante, fazendo a IA parecer uma linha pequena no demonstrativo de resultados
- Mas, se o uso real de API da mesma equipe for calculado com base no consumo de tokens, o custo pode chegar a US$ 15.000 a US$ 40.000 por mês, dependendo da intensidade de uso, transformando-se em uma despesa que exige um centro de custo próprio
- Quando o preço for reajustado, empresas que enxergavam a IA de US$ 20 por mês como um insumo permanentemente barato podem acabar recebendo uma cobrança não prevista justamente quando a ferramenta já estiver tão incorporada ao fluxo de trabalho que será difícil removê-la
- O subsídio cria dependência, e a dependência vira uma armadilha corporativa que dificulta evitar aumentos de preço
- O Q1 2026 AI Quarterly Pulse da KPMG estima que organizações nos EUA esperam gastar em média US$ 207 milhões com IA nos próximos 12 meses, quase o dobro em relação ao mesmo período do ano anterior
- Segundo uma pesquisa do Goldman Sachs, muitas grandes empresas já estão ultrapassando seus orçamentos de IA em vários dígitos, e os gastos com IA podem se aproximar dos salários de engenheiros em um futuro próximo
- Swami Chandrasekaran, líder do laboratório de IA e dados da KPMG North America, disse à Marketplace que até apenas um ou dois trimestres atrás ninguém se preocupava com o custo de consumo de LLMs
- O economista Brian Jabarian, da University of Chicago, ao aconselhar empresas em transformações com IA, disse que a hora da conta chegar está se aproximando
O IPO pode forçar uma reprecificação
- OpenAI e Anthropic estão se preparando para IPO, e nesse processo pode aumentar a pressão para reduzir a diferença entre o preço da assinatura e o custo real
- Foi reportado que a Anthropic ultrapassou US$ 30 bilhões em receita anualizada, acima dos US$ 9 bilhões no fim de 2025
- A OpenAI é retratada como operando a um ritmo de receita de cerca de US$ 25 bilhões
- A OpenAI projeta consumo acumulado de caixa de US$ 115 bilhões até 2029 e é apresentada como tendo prometido US$ 665 bilhões em gastos com computação até 2030
- A Oracle é apresentada como tendo assumido US$ 43 bilhões em dívida em um ano fiscal para construir data centers para a OpenAI
- Enquanto continuam privadas e queimando capital de risco, essas empresas podem subsidiar o custo de inferência, operar modelos no prejuízo e manter planos de US$ 20 por mês cujo custo de entrega supera US$ 100
- Depois do IPO, o mercado público passará a exigir margens, analistas vão cobrar economia unitária, e investidores vão querer um caminho para rentabilidade que não dependa de captação infinita
- As formas mais rápidas de reduzir essa diferença de preço são aumento de preço, limitação de uso e transição para cobrança baseada em consumo; as três podem afetar fortemente os assinantes corporativos atuais
Sinais de reprecificação já estão aparecendo
- O GitHub está migrando para cobrança baseada em uso em 1º de junho de 2026 e substituirá solicitações premium de tarifa fixa por AI Credits baseados em tokens
- A Microsoft aumentou o preço do Microsoft 365 duas vezes em 4 anos, e o reajuste mais recente está diretamente ligado aos custos de infraestrutura de IA
- A OpenAI introduziu um novo nível de preço real para usuários intensivos, com o plano Pro de US$ 100
- O plano Max de US$ 200 por mês da Anthropic é um exemplo de quanto o uso comprometido pode realmente custar quando os subsídios terminarem
- Geoff Webb, VP da Conga, disse que a escala da corrida pela liderança no mercado de IA é gigantesca, e como o custo para dominá-la também é enorme, há grande chance de mudanças rápidas no modelo de negócios e no preço dos serviços durante o processo de monetização e retorno sobre investimento
O que líderes empresariais devem fazer agora
- Empresas devem auditar o consumo real de tokens por equipe, em vez de apenas contar assentos
- É preciso modelar como os custos de IA mudariam em cenários de 2x, 5x e 10x em relação ao preço atual
- É preciso criar opcionalidade de fornecedores na stack para que uma mudança de preço de um único provedor não destrua de repente o orçamento
- A lacuna de custos da IA deve ser discutida com o CFO antes que o próprio CFO levante o problema
- A diferença entre o que a organização paga hoje por IA e o que poderá pagar daqui a 18 meses pode se tornar um dos maiores aumentos de despesa que muitas empresas terão de absorver
- Pode haver empresas que precisarão explicar por que uma ferramenta que antes custava menos que o almoço da equipe passou a exigir um orçamento anual de seis dígitos
- A era dos subsídios está acabando, e muitas empresas ainda nem começaram essa conversa
4 comentários
Parece a mesma questão da época dos mainframes..
Se a configuração for de que servidores são caros e os recursos são escassos, enquanto os computadores pessoais são lentos,
no fim os servidores também ficam baratos e os computadores pessoais também ganham desempenho... acho que o tempo vai resolver.
Se for caro, é só não usar..
Como presumem que, mesmo caro, as empresas vão pagar, os provedores de LLM devem estar aumentando os preços. Fico curioso para ver como vão evoluir LLMs open source como GLM, qwen e deepseek daqui para frente. As pessoas vão começar a fazer as contas: vale pagar esse preço para usar modelos de fronteira ou, mesmo com o trabalho de implementar uma infraestrutura própria com vLLM, faz mais sentido usar open source?
Comentários do Hacker News
Toda assinatura de IA parece uma bomba-relógio para os provedores de modelos de fronteira
Em alguns anos, vai ser possível rodar modelos locais tão bons quanto os modelos de fronteira de hoje com custo quase zero, e a base do mercado corporativo das empresas de fronteira vai ruir
Só os requisitos de memória já são enormes, e por um bom tempo ainda vai ser muito mais eficiente em termos de custo usar hardware dedicado compartilhado com alta taxa de utilização
Como precisam continuar melhorando para ficar à frente uns dos outros e dos modelos com pesos abertos, isso está mais para o oposto de uma bomba-relógio
Os tokens de inferência no nível atual vão continuar ficando mais baratos, e não sei se o estado final será local, porque as exigências de hardware são altas, mas a concorrência tende a empurrar as margens de lucro para perto de zero
Discussão longa sobre esse tema: https://corecursive.com/the-pre-training-wall-and-the-treadm...
Estou monitorando o uso de tokens e me movendo ativamente para reduzir o custo de inferência e internalizar isso, em vez de simplesmente gastar muitos tokens de forma bruta
Meu chefe ficou muito satisfeito e agora estamos implantando isso de forma mais ampla. Acho que esse é o futuro
As leis de escala já ficaram pesadas, e não dá para cair nesse exagero do “exponencial”
Além disso, o concorrente real são os modelos de fronteira de daqui a 2 anos
Hoje é preciso hardware maior, mais caro e que consome mais energia do que há 1 ou 2 anos
O tom exagerado dos textos dos dois lados da IA é muito cansativo
Queria ficar na frente de um quadro branco com alguém que realmente entende de economia e do negócio dos provedores de tokens e perguntar “como se eu tivesse cinco anos”
Queria entender se para o provedor de tokens isso é um jogo de margem e para o consumidor é um jogo de qualidade de serviço/produto, se a linha entre qualidade e margem cruza em algum momento e, se cruza, se isso é uma corrida para chegar lá antes que o dinheiro acabe, e se há casos históricos em que a diferença entre os dois era tão grande
Os LLMs parecem únicos porque praticamente não há limite para o quanto o consumidor “espera que melhorem”, e isso é diferente de serviços como e-mail, que são fáceis de escalar do ponto de vista de recursos computacionais
É uma pergunta bem de iniciante, mas também fico curioso por que eles querem fazer IPO antes de existir um modelo de negócio sustentável. Qual é a vantagem?
Pelos links compartilhados aqui, cerca de 30% dos gastos da Anthropic vão para inferência, e os outros 70% para P&D, como o desenvolvimento do próximo modelo
Refletindo isso e adicionando lucro, se simplificar os números, bastaria vender a cerca de US$ 1 por milhão de tokens para ganhar dinheiro
Hoje o preço da API é US$ 25 por milhão de tokens, então não tenho dúvida de que há lucratividade
Já o plano Max de US$ 200 por mês, se usado ao extremo, pode chegar a 10 bilhões de tokens por mês, o que dá US$ 0,02 por milhão de tokens, ou seja, um prejuízo enorme, e isso vai desaparecer em algum momento
Ainda assim, se alguém usa 100 milhões de tokens por mês no plano Anthropic de US$ 100 por mês, a empresa está ganhando dinheiro
Para usar 10 bilhões de tokens por mês, a pessoa precisaria trabalhar por muito tempo e ser realmente muito boa em usar IA, e alguém assim provavelmente já usa IA há anos e já tirava proveito dela antes do Opus
Vai se decepcionar se perder o Opus, mas esse tipo de usuário é justamente o tipo que também consegue aproveitar bem modelos menos fortes, então em alguns anos talvez migre para um modelo open source hospedado internamente e ainda consiga algo no nível atual de US$ 0,02 por milhão de tokens
Por isso, não me convence o clima pessimista do texto. A situação vai mudar, mas isso não significa o fim do uso de IA
Concordo com o sentimento do texto, mas o estilo parece muito escrito por LLM
Especialmente a estrutura das seções e frases de efeito como “That is not a rounding error. That is a line item that needs its own budget code.”
Isso é bem irritante, e com o mesmo prompt quase não vejo isso no Gemini
Não tem nome de autor no artigo
Brad Gerstner confirmou que os tokens não estão sendo vendidos no prejuízo
Independentemente de como separem API e assinatura na fórmula, as empresas estão lucrando na venda pura de tokens
Se incluir salários e remuneração em ações, pode haver prejuízo, mas os tokens em si já são lucrativos hoje
Pode até estar agora, mas não foi assim que chegou até aqui
O investimento a recuperar é de trilhões de dólares e a receita é, no máximo, de dezenas de bilhões, então essa conta de que os tokens vão dar lucro no curto prazo não fecha
A inferência não precisa apenas ser lucrativa isoladamente; ela também precisa bancar esse custo
[0] https://epoch.ai/data-insights/openai-compute-spend
Os prejuízos estão sendo empurrados para frente dentro de uma estrutura estranha de financiamento circular, e isso provavelmente vai ruir algum dia em uma crise de dívida
Acho que esses estão recebendo um subsídio pesado, mas são os únicos em que realmente sinto valor
O problema da “IA” como um todo é que é fácil viver sem ela
As empresas de IA sabem disso, os usuários sabem disso, e até o gestor mais favorável a agentes de IA sabe disso
Se você imaginar remover toda a IA do mundo agora, o resultado seria só o trabalho normal de sempre
O texto não enfatiza isso o suficiente. É para ficar com medo do dia em que a revisão de PR vai ter de voltar para um engenheiro de verdade?
À medida que a tecnologia se integra mais profundamente, isso vai deixando de ser verdade
Daria para dizer o mesmo alguns anos depois do surgimento do motor elétrico: bastaria voltar ao vapor
Mas hoje, tentar viver sem motor elétrico faria a sociedade entrar em colapso
A pergunta não é se dá para viver sem isso agora, e sim se ainda vai dar para viver sem isso daqui a 5 a 10 anos, quando estiver totalmente integrado
Não para gerar receita honesta, mas para enfiar produtos de IA tão fundo que “vamos simplesmente tirar a IA” nem pareça mais uma opção
Mesmo que o custo de manutenção continue subindo até ultrapassar o nível de resgate estatal estilo companhia aérea
É uma nova camada intermediária de extração de riqueza vendida com promessas falsas
Pelo menos para escrever JavaScript, eu não consigo mais viver sem IA
Dá a impressão de que tratam isso como um bichinho de estimação que morre se você não der atenção de vez em quando
O texto está errado. Não é que esse tipo de assinatura não seja oferecido a empresas
As empresas pagam valores muito mais próximos dos preços de API
A estratégia é acostumar as pessoas com tokens ilimitados nas assinaturas individuais e esperar que esse comportamento migre para o trabalho
Assentos de equipe ou enterprise são mais caros do que os preços para consumidor, mas têm preço fixo com limites de uso que se renovam
Você pode atribuir aos membros assentos equivalentes aos planos de US$ 20/100/200 por mês, ou fazer tudo por uso medido
Existem várias formas de comprar
Também existem planos pay-as-you-go correspondentes aos planos equivalentes de consumidor
Na minha empresa, a cobrança é pelo uso de API
“No geral, o padrão é o mesmo. Precificação para adoção, não para economia. Prende as organizações. Torna a IA uma parte estrutural do trabalho diário de todas as equipes. A conta fica para depois.”
US$ 10 mil por mês não é nada, mas se esse dinheiro sustenta uma equipe de 10 a 20 engenheiros, é uma alavancagem bem interessante
Não li o texto original até o fim, mas deu para perceber que foi escrito por IA
Talvez o OpenRouter possa servir como referência para o custo de fornecimento de IA
Fico ouvindo o tempo todo que ele tem melhor custo-benefício do que o Claude, e se for verdade isso parece indicar que a Anthropic ou é particularmente ineficiente ou está lucrando com inferência
Podem perder dinheiro no treinamento, mas isso talvez seja só o custo de continuar sendo um laboratório de ponta
Se uma empresa específica quebrar por dívida ou algo assim, as empresas não poderiam simplesmente trocar de fornecedor?
Se eu vir mais uma vez frases como “It’s not X. It’s Y.” ou o uso metafórico de “load-bearing”, vou vomitar
“A era dos subsídios não está terminando com elegância. Está começando a rachar em toda parte.”
“A pergunta não é se foi um bom negócio. É por quanto tempo esse negócio aguenta.”
“Um desenvolvedor rodando três ou quatro agentes de codificação ao mesmo tempo não usa 3x ou 4x os tokens de uma conversa em chat. Usa não uma ordem de grandeza, mas mais de uma ordem de grandeza.”
“Isso não são mais experimentos. São fluxos de trabalho estruturais.”
“Isso não é erro de arredondamento. É um item que precisa do próprio código orçamentário.”
Pelo menos dá para torcer por isso
Tinha dados e a lógica parecia plausível, mas ali pela metade começaram a aparecer exemplo de tendência, depois outro exemplo, depois um terceiro, e aí veio o “isso não é simplesmente X, é Y”
É tão irritante quanto estar lendo um texto bem escrito, clicar no link da fonte e tomar um rickroll
Cliente enterprise não usa assinatura Claude Pro de US$ 20 por mês
Na nossa empresa, damos aos desenvolvedores um limite de uso de cerca de US$ 1 mil por mês, e pelo que vejo a economia em relação ao custo de API é de no máximo uns 30%
Não é um nível de subsídio maluco
Em muitos outros cargos, o permitido é só US$ 50 por mês, e essas pessoas continuam batendo no limite
O GitHub Copilot vem usando esse modelo em assentos business e enterprise, mas vai esbarrar no limite em breve
Acho que, depois de junho, quando reorganizarem as contas Pro e Pro+ de consumidor, isso vai acompanhar rapidamente
Parece que a OpenAI está distribuindo tokens para prender clientes, então minha maior preocupação são mudanças bruscas de preço e termos do lado da OpenAI depois do IPO
A Anthropic já está agindo com responsabilidade nessa parte, e o GitHub Copilot também parece estar tentando corrigir os subsídios excessivos nos próximos meses
Porque cobrava por “requisição”, não por token
Uma única requisição de 3 centavos podia queimar mais de US$ 20 em tokens, e esse modelo acaba neste mês
Eu também estava preocupado porque vinha processando grandes blocos de trabalho com o GHCP, mas o novo estimador de cobrança mostrou algo na faixa de US$ 150 a 200 por mês com base em preços de API
Ainda é subsídio para uma assinatura de US$ 20 por mês, mas não em um nível insano
Se você usar bastante ferramentas de codificação em estilo agente de forma responsável, provavelmente vai cair em algo perto de US$ 200 por mês com preços de API
Se o provedor ainda ganha dinheiro nesse preço, então para uma empresa no Ocidente que contrata desenvolvedores, isso não é difícil de aceitar quando se considera o tempo economizado
O risco real está para os vibe coders em projetos pessoais
A era de abusar de planos subsidiados para criar apps gigantes está acabando
Se for substituir desenvolvedores, faz sentido custar mais do que US$ 20 ou US$ 100 por mês
O problema real das empresas de LLM é que elas ainda não mostraram valor fora da programação
Sem isso, vão acabar reduzidas a ferramentas de coding
É por isso que estão correndo agora, e a chave é que outros fluxos de trabalho conseguem automatizar
Talvez consigam automatizar todo o trabalho burocrático
Se outras áreas se desenvolverem, vão mudar o modelo de preços
Isso pode ter valor sim