A IA está desacelerando

(wheresyoured.at)

22 pontos por GN⁺ 2026-06-09 | 11 comentários | Compartilhar no WhatsApp

A infraestrutura de IA generativa precisa gerar mais de US$ 2 trilhões em receita anual de computação de IA até 2030 para justificar os investimentos em datacenters e os compromissos de capacidade computacional
Os 190 GW de datacenters planejados representam entre US$ 9,5 trilhões e US$ 15 trilhões, aplicando um custo de US$ 80 bilhões a US$ 100 bilhões por GW, e para viabilizá-los será necessária a emissão anual de dívida de datacenter entre US$ 500 bilhões e US$ 1 trilhão
Estima-se que a OpenAI consumirá pelo menos US$ 852 bilhões até o fim de 2030, e a Anthropic precisará atingir a meta de US$ 174 bilhões em receita anual em 2029 para sustentar seus compromissos de computação
Após a mudança para a cobrança baseada em tokens, as empresas vêm tendo dificuldade para visualizar os gastos com IA e medir ROI, e Uber, T-Mobile e Brex definiram limites de gasto com tokens por funcionário
Atualmente, 89% da receita de startups de IA está concentrada em OpenAI e Anthropic, então será necessária uma demanda anual adicional por computação de IA de pelo menos US$ 250 bilhões para justificar a escala de computação em construção

A IA não pode se dar ao luxo de desacelerar — mais de US$ 3 trilhões em receita serão necessários até o fim de 2030

Aplicando diretamente os dados da Sightline Climate, a capacidade planejada de datacenters é de 190 GW; aplicando a declaração de Jensen Huang de US$ 80 bilhões a US$ 100 bilhões por GW, o custo calculado fica entre US$ 9,5 trilhões e US$ 15 trilhões
A formulação da Bloomberg sobre uma construção de datacenters de US$ 3 trilhões não bate com esse cálculo, e o capital necessário terá de ser levantado de algum lugar
Uma reportagem do Financial Times avaliou que os bancos podem não conseguir absorver a dívida de datacenters, e a emissão atual de cerca de US$ 250 bilhões por ano precisaria subir para US$ 500 bilhões a US$ 1 trilhão por ano para viabilizar a construção real
A NVIDIA projeta US$ 1 trilhão em receita até o fim de 2027 e, como 54% da receita vem de três clientes, a receita futura dependerá de poucos clientes e da capacidade de contrapartes levantarem dívida
A venda de US$ 85 bilhões em participação pela Google e os planos da Meta de vender participações no valor de dezenas de bilhões de dólares estão ligados ao cenário em que fica mais difícil para hyperscalers levantar dívida

Os compromissos de computação de OpenAI e Anthropic

Os compromissos de computação e chips da Anthropic chegaram a US$ 330 bilhões entre Google, Amazon e Microsoft, mais US$ 30 bilhões com a CoreWeave e US$ 15 bilhões com a SpaceX
A Anthropic precisará atingir a meta de US$ 174 bilhões em receita anual em 2029 para sustentar esse custo de computação
A Anthropic levantou US$ 95 bilhões nas rodadas de fevereiro, abril e maio, mas esse dinheiro e o fluxo de caixa não bastam para cobrir os custos, exigindo pelo menos mais US$ 200 bilhões no ano seguinte
A OpenAI deve consumir pelo menos US$ 852 bilhões até o fim de 2030 e assumiu mais de US$ 770 bilhões em compromissos de computação com Microsoft, Amazon, CoreWeave, Cerebras e Oracle
A captação de US$ 122 bilhões da OpenAI em março é insuficiente para cobrir os custos, e a empresa precisará de pelo menos mais US$ 250 bilhões até o fim do ano

Cálculo da receita de datacenters e risco para a Oracle

A IA generativa e a computação de IA precisam gerar mais de US$ 2 trilhões por ano em receita até 2030; caso contrário, o capex dos datacenters e os pagamentos dos compromissos de Anthropic e OpenAI não se sustentam
Aplicando PUE de 1,35 aos 190 GW de datacenters, a carga principal de TI fica em cerca de 140 GW, o que exigiria US$ 1,75 trilhão em receita anual com base em uma cobrança de US$ 12,5 milhões por MW
Mesmo que apenas metade da capacidade planejada seja construída, os datacenters ainda precisariam de US$ 875 bilhões em receita anual para não entrarem em falta de recursos
OpenAI e Anthropic projetam, respectivamente, US$ 184 bilhões e US$ 174 bilhões em receita em 2029, somando apenas US$ 358 bilhões
Se a OpenAI não conseguir ou não quiser bancar a computação da Oracle, a Oracle pode ficar sem caixa; a Oracle está gastando entre US$ 340 bilhões e US$ 700 bilhões em datacenters de 7,1 GW para a OpenAI

O gasto atual com IA não é suficiente

O plano da Salesforce de gastar US$ 300 milhões com a Anthropic em 2026 está muito abaixo da escala necessária
A soma da demanda atual de computação de todas as empresas de IA no mundo não chega a US$ 100 bilhões, mas em 2030 será necessário dez vezes isso
Segundo reportagem do The Information, a concentração da receita de startups de IA em OpenAI e Anthropic chega a {p:89}, ou seja, 89%
A taxa anualizada de US$ 37 bilhões em IA da Microsoft é composta principalmente por computação para a OpenAI, e o CEO da Microsoft AI, Mustafa Suleyman, disse que os modelos da Anthropic são caros demais e quer reduzir seu uso na Microsoft a zero
Mesmo que Anthropic e OpenAI consumam US$ 500 bilhões por ano em computação, ainda seriam necessários mais de US$ 250 bilhões anuais adicionais em receita de computação para justificar a construção dos datacenters

Cobrança por tokens e incerteza de ROI

Não é possível medir o custo e o retorno sobre investimento de tarefas específicas de IA, e as empresas vêm ampliando a adoção de IA sem medir os resultados produzidos
Anthropic e OpenAI migraram clientes para cobrança baseada em tokens no primeiro trimestre de 2026 e, em apenas dois a três meses, a incerteza sobre custo de IA e ROI virou tema recorrente na mídia de negócios
Em uma pesquisa da KPMG citada pelo Wall Street Journal, a visibilidade dos custos de IA se divide em {b:26,50,22}: 26% total, 50% parcial e 22% nenhuma ou apenas após a cobrança
Uma empresa, sem qualquer controle de gastos, consumiu US$ 500 milhões em modelos da Anthropic em um único mês, e a Uber esgotou seu orçamento anual de tokens em apenas um trimestre
A Uber limita o gasto com IA a US$ 1.500 por usuário por mês, a T-Mobile impôs temporariamente US$ 2.000 por usuário por mês, e a Brex limitou a US$ 500 por semana para engenheiros e US$ 5 por semana para não engenheiros

Agentes de programação, loops e o problema do resultado

Boris Cherny, responsável pelo Claude Code, e Peter Steinberger, evangelista do OpenClaw pertencente à OpenAI, pedem que os usuários projetem loops para agentes
Loops são uma forma de fazer o LLM continuar agindo pelo tempo desejado sem que o usuário precise inserir prompts adicionais
Em assinaturas subsidiadas, o custo dos erros do modelo fica escondido pelos planos mensais de US$ 20, US$ 100 ou US$ 200, mas quando o usuário paga o custo real, o preço do fracasso aparece sem filtro
Isso se conecta a estudos segundo os quais, quanto mais o LLM raciocina, mais alucinações aparecem, enquanto a abordagem por agentes faz o próprio LLM elaborar seus planos
A Notion bloqueou o acesso à Anthropic por algumas horas após uma interrupção no serviço da Anthropic, e muitos dos apps gerados por ferramentas de programação com IA não passam de slopware inútil e inseguro

A metáfora da aranha metálica gigante

A aranha metálica gigante é um dispositivo de US$ 1 milhão, e cada uso consome US$ 40 mil em combustível, mas ela consegue pegar objetos ou preparar o jantar
O mesmo dispositivo tanto pode pegar com precisão uma Diet Coke na geladeira quanto abrir um buraco nela, e o usuário terá de pagar US$ 40 mil independentemente do resultado
Graças aos subsídios, o usuário comum vivencia a destruição só de vez em quando, mas as empresas arcam com o custo real e os fabricantes perdem bilhões por ano com treinamento e manutenção
Novos recursos ampliam o conjunto de coisas que supostamente podem ser feitas, mas cada funcionalidade adicionada custa centenas de milhões de dólares, e às vezes nem fica claro se de fato houve novo aprendizado
Mesmo com um estudo que aponta aumento na capacidade de completar 50% de tarefas de determinado comprimento, a aranha da metáfora continua imprevisível, pode errar a qualquer momento e também agir sem que o usuário peça

A economia circular da IA e a demanda real por produtos

A IA generativa tem alto custo de execução do serviço, os principais laboratórios de IA não têm um caminho para a lucratividade, e o custo e o ROI de tarefas baseadas em LLM também não conseguem ser medidos
Projetos de IA podem aumentar os custos operacionais de 10% a 100%, e, ao contrário da promessa de custos menores tanto para operadores de serviços de IA quanto para clientes, os custos vêm aumentando
Os altos custos mantêm a estrutura em que laboratórios de IA enviam dinheiro para parceiros hyperscalers de computação, e esses recursos circulam de volta para os laboratórios e para a demanda por GPUs da NVIDIA
Se OpenAI ou Anthropic buscarem lucratividade ou sustentabilidade, a demanda por computação de IA cairá, assim como a demanda por Azure, Google Cloud, Amazon Web Services, CoreWeave, Oracle Cloud Infrastructure e GPUs da NVIDIA
Para que os compromissos e projeções atuais fechem, toda a stack de IA precisa crescer 10 vezes, com mais US$ 250 bilhões por ano em demanda de computação de IA e pelo menos mais duas empresas do porte de OpenAI ou Anthropic

11 comentários

geek12356 2026-06-09

Mais alguém sente que, conforme o opus 4.6 foi sendo atualizado para 4.7 e 4.8, o desempenho parece ter piorado na prática?

savvykang 2026-06-09

Ultimamente tenho percebido que a tradução para o coreano ficou estranha; chegaram a traduzir pain point como "valor dolorido".

tazuya 2026-06-10

Nossa... acho que a empresa está mal. Uma tradução num nível que nem o Google Tradutor faria.

comnwav 2026-06-09

Parece que virou um lixo completo...

geek12356 2026-06-09

Pois é, né?? De repente ele parou de conseguir fazer o que antes fazia bem.........

comnwav 2026-06-09

Ele respondia às perguntas de forma concisa e resolvia as tarefas com facilidade, mas agora explica tudo da forma mais prolixa possível e aborda as coisas de um jeito mais complicado.

onestone 2026-06-09

Concordo totalmente. Aquele lance de sacar tudo e organizar certinho sumiu.

mammal 2026-06-09

A API nunca deixou de cobrar com base em tokens...

shm3215 2026-06-09

Acho que o que está sendo dito no texto é sobre a Anthropic ter mudado recentemente o plano Enterprise de assinatura para cobrança por uso. Em comparação com a assinatura, a cobrança por uso é até cerca de 10 vezes mais cara por token, e a Anthropic estaria usando uma estratégia de vender o plano de assinatura individual como produto-isca para prender os desenvolvedores no ecossistema, fazendo com que as empresas acabem pagando a cara tarifa por uso do Enterprise.
Do ponto de vista das empresas, isso significa que o custo do modelo de cobrança baseado em tokens é alto demais, então o ROI fica incerto.