A IA está desacelerando
(wheresyoured.at)- A infraestrutura de IA generativa precisa gerar mais de US$ 2 trilhões em receita anual de computação de IA até 2030 para justificar os investimentos em datacenters e os compromissos de capacidade computacional
- Os 190 GW de datacenters planejados representam entre US$ 9,5 trilhões e US$ 15 trilhões, aplicando um custo de US$ 80 bilhões a US$ 100 bilhões por GW, e para viabilizá-los será necessária a emissão anual de dívida de datacenter entre US$ 500 bilhões e US$ 1 trilhão
- Estima-se que a OpenAI consumirá pelo menos US$ 852 bilhões até o fim de 2030, e a Anthropic precisará atingir a meta de US$ 174 bilhões em receita anual em 2029 para sustentar seus compromissos de computação
- Após a mudança para a cobrança baseada em tokens, as empresas vêm tendo dificuldade para visualizar os gastos com IA e medir ROI, e Uber, T-Mobile e Brex definiram limites de gasto com tokens por funcionário
- Atualmente, 89% da receita de startups de IA está concentrada em OpenAI e Anthropic, então será necessária uma demanda anual adicional por computação de IA de pelo menos US$ 250 bilhões para justificar a escala de computação em construção
A IA não pode se dar ao luxo de desacelerar — mais de US$ 3 trilhões em receita serão necessários até o fim de 2030
- Aplicando diretamente os dados da Sightline Climate, a capacidade planejada de datacenters é de 190 GW; aplicando a declaração de Jensen Huang de US$ 80 bilhões a US$ 100 bilhões por GW, o custo calculado fica entre US$ 9,5 trilhões e US$ 15 trilhões
- A formulação da Bloomberg sobre uma construção de datacenters de US$ 3 trilhões não bate com esse cálculo, e o capital necessário terá de ser levantado de algum lugar
- Uma reportagem do Financial Times avaliou que os bancos podem não conseguir absorver a dívida de datacenters, e a emissão atual de cerca de US$ 250 bilhões por ano precisaria subir para US$ 500 bilhões a US$ 1 trilhão por ano para viabilizar a construção real
- A NVIDIA projeta US$ 1 trilhão em receita até o fim de 2027 e, como 54% da receita vem de três clientes, a receita futura dependerá de poucos clientes e da capacidade de contrapartes levantarem dívida
- A venda de US$ 85 bilhões em participação pela Google e os planos da Meta de vender participações no valor de dezenas de bilhões de dólares estão ligados ao cenário em que fica mais difícil para hyperscalers levantar dívida
Os compromissos de computação de OpenAI e Anthropic
- Os compromissos de computação e chips da Anthropic chegaram a US$ 330 bilhões entre Google, Amazon e Microsoft, mais US$ 30 bilhões com a CoreWeave e US$ 15 bilhões com a SpaceX
- A Anthropic precisará atingir a meta de US$ 174 bilhões em receita anual em 2029 para sustentar esse custo de computação
- A Anthropic levantou US$ 95 bilhões nas rodadas de fevereiro, abril e maio, mas esse dinheiro e o fluxo de caixa não bastam para cobrir os custos, exigindo pelo menos mais US$ 200 bilhões no ano seguinte
- A OpenAI deve consumir pelo menos US$ 852 bilhões até o fim de 2030 e assumiu mais de US$ 770 bilhões em compromissos de computação com Microsoft, Amazon, CoreWeave, Cerebras e Oracle
- A captação de US$ 122 bilhões da OpenAI em março é insuficiente para cobrir os custos, e a empresa precisará de pelo menos mais US$ 250 bilhões até o fim do ano
Cálculo da receita de datacenters e risco para a Oracle
- A IA generativa e a computação de IA precisam gerar mais de US$ 2 trilhões por ano em receita até 2030; caso contrário, o capex dos datacenters e os pagamentos dos compromissos de Anthropic e OpenAI não se sustentam
- Aplicando PUE de 1,35 aos 190 GW de datacenters, a carga principal de TI fica em cerca de 140 GW, o que exigiria US$ 1,75 trilhão em receita anual com base em uma cobrança de US$ 12,5 milhões por MW
- Mesmo que apenas metade da capacidade planejada seja construída, os datacenters ainda precisariam de US$ 875 bilhões em receita anual para não entrarem em falta de recursos
- OpenAI e Anthropic projetam, respectivamente, US$ 184 bilhões e US$ 174 bilhões em receita em 2029, somando apenas US$ 358 bilhões
- Se a OpenAI não conseguir ou não quiser bancar a computação da Oracle, a Oracle pode ficar sem caixa; a Oracle está gastando entre US$ 340 bilhões e US$ 700 bilhões em datacenters de 7,1 GW para a OpenAI
O gasto atual com IA não é suficiente
- O plano da Salesforce de gastar US$ 300 milhões com a Anthropic em 2026 está muito abaixo da escala necessária
- A soma da demanda atual de computação de todas as empresas de IA no mundo não chega a US$ 100 bilhões, mas em 2030 será necessário dez vezes isso
- Segundo reportagem do The Information, a concentração da receita de startups de IA em OpenAI e Anthropic chega a {p:89}, ou seja, 89%
- A taxa anualizada de US$ 37 bilhões em IA da Microsoft é composta principalmente por computação para a OpenAI, e o CEO da Microsoft AI, Mustafa Suleyman, disse que os modelos da Anthropic são caros demais e quer reduzir seu uso na Microsoft a zero
- Mesmo que Anthropic e OpenAI consumam US$ 500 bilhões por ano em computação, ainda seriam necessários mais de US$ 250 bilhões anuais adicionais em receita de computação para justificar a construção dos datacenters
Cobrança por tokens e incerteza de ROI
- Não é possível medir o custo e o retorno sobre investimento de tarefas específicas de IA, e as empresas vêm ampliando a adoção de IA sem medir os resultados produzidos
- Anthropic e OpenAI migraram clientes para cobrança baseada em tokens no primeiro trimestre de 2026 e, em apenas dois a três meses, a incerteza sobre custo de IA e ROI virou tema recorrente na mídia de negócios
- Em uma pesquisa da KPMG citada pelo Wall Street Journal, a visibilidade dos custos de IA se divide em : 26% total, 50% parcial e 22% nenhuma ou apenas após a cobrança
- Uma empresa, sem qualquer controle de gastos, consumiu US$ 500 milhões em modelos da Anthropic em um único mês, e a Uber esgotou seu orçamento anual de tokens em apenas um trimestre
- A Uber limita o gasto com IA a US$ 1.500 por usuário por mês, a T-Mobile impôs temporariamente US$ 2.000 por usuário por mês, e a Brex limitou a US$ 500 por semana para engenheiros e US$ 5 por semana para não engenheiros
Agentes de programação, loops e o problema do resultado
- Boris Cherny, responsável pelo Claude Code, e Peter Steinberger, evangelista do OpenClaw pertencente à OpenAI, pedem que os usuários projetem loops para agentes
- Loops são uma forma de fazer o LLM continuar agindo pelo tempo desejado sem que o usuário precise inserir prompts adicionais
- Em assinaturas subsidiadas, o custo dos erros do modelo fica escondido pelos planos mensais de US$ 20, US$ 100 ou US$ 200, mas quando o usuário paga o custo real, o preço do fracasso aparece sem filtro
- Isso se conecta a estudos segundo os quais, quanto mais o LLM raciocina, mais alucinações aparecem, enquanto a abordagem por agentes faz o próprio LLM elaborar seus planos
- A Notion bloqueou o acesso à Anthropic por algumas horas após uma interrupção no serviço da Anthropic, e muitos dos apps gerados por ferramentas de programação com IA não passam de slopware inútil e inseguro
A metáfora da aranha metálica gigante
- A aranha metálica gigante é um dispositivo de US$ 1 milhão, e cada uso consome US$ 40 mil em combustível, mas ela consegue pegar objetos ou preparar o jantar
- O mesmo dispositivo tanto pode pegar com precisão uma Diet Coke na geladeira quanto abrir um buraco nela, e o usuário terá de pagar US$ 40 mil independentemente do resultado
- Graças aos subsídios, o usuário comum vivencia a destruição só de vez em quando, mas as empresas arcam com o custo real e os fabricantes perdem bilhões por ano com treinamento e manutenção
- Novos recursos ampliam o conjunto de coisas que supostamente podem ser feitas, mas cada funcionalidade adicionada custa centenas de milhões de dólares, e às vezes nem fica claro se de fato houve novo aprendizado
- Mesmo com um estudo que aponta aumento na capacidade de completar 50% de tarefas de determinado comprimento, a aranha da metáfora continua imprevisível, pode errar a qualquer momento e também agir sem que o usuário peça
A economia circular da IA e a demanda real por produtos
- A IA generativa tem alto custo de execução do serviço, os principais laboratórios de IA não têm um caminho para a lucratividade, e o custo e o ROI de tarefas baseadas em LLM também não conseguem ser medidos
- Projetos de IA podem aumentar os custos operacionais de 10% a 100%, e, ao contrário da promessa de custos menores tanto para operadores de serviços de IA quanto para clientes, os custos vêm aumentando
- Os altos custos mantêm a estrutura em que laboratórios de IA enviam dinheiro para parceiros hyperscalers de computação, e esses recursos circulam de volta para os laboratórios e para a demanda por GPUs da NVIDIA
- Se OpenAI ou Anthropic buscarem lucratividade ou sustentabilidade, a demanda por computação de IA cairá, assim como a demanda por Azure, Google Cloud, Amazon Web Services, CoreWeave, Oracle Cloud Infrastructure e GPUs da NVIDIA
- Para que os compromissos e projeções atuais fechem, toda a stack de IA precisa crescer 10 vezes, com mais US$ 250 bilhões por ano em demanda de computação de IA e pelo menos mais duas empresas do porte de OpenAI ou Anthropic
2 comentários
A API nunca deixou de cobrar com base em tokens...
Opiniões no Hacker News
Hoje a Apple lançou recursos de IA reformulados e, segundo várias reportagens, a Apple estaria operando isso pagando ao Google algo em torno de US$ 1 bilhão por ano
Na prática, isso parece mais um licenciamento de propriedade intelectual, e o Google aparentemente acha aceitável ceder por esse valor o direito de operar e destilar seus próprios modelos
Mesmo que a receita de consumo seja só parte do quebra-cabeça inteiro, fica a dúvida de por que usuários de Mac ou iPhone precisariam pagar pelo ChatGPT se a nova IA da Apple já os atender
O Google também vai colocar ferramentas parecidas nos celulares e continuar oferecendo recursos de IA na busca, então não está claro onde está a evidência de que a IA para consumidores vale para Anthropic ou OpenAI muito mais do que US$ 1 bilhão por ano depois que a tecnologia da Apple existe
Mesmo que a OpenAI feche um acordo para entrar em celulares Samsung e a Samsung esteja 10 vezes mais desesperada que a Apple, isso daria algo como US$ 10 bilhões por ano, e se a projeção de receita de consumo da OpenAI para 2026 é de US$ 14–15 bilhões, mesmo atingindo isso parece difícil sustentar depois que usuários de iPhone tiverem recursos nativos úteis
Ed Zitron é mais para um agitador barulhento em estilo britânico, mas no geral parece estar dizendo coisas corretas
Mesmo com botão do Copilot no Windows, as pessoas usam GPT, o Microsoft Edge não é o navegador mais popular no Windows, e o Instagram Threads também não causou um grande impacto no TikTok
A pergunta está invertida. As pessoas usam o que gostam e têm forte preferência por continuar usando isso
Não é preciso um fosso gigantesco; o problema aparece quando os usuários continuam insatisfeitos com o produto ou quando existe um concorrente muito melhor de que todo mundo fala
Se os recursos da Apple não oferecerem uma vantagem significativa sobre simplesmente usar o GPT, é difícil esperar um milagre
A questão que sobra é se vou continuar usando o Kagi por causa da busca ou se a nova Siri vai me levar, de forma geral, a tudo de que eu preciso. Vou precisar prestar mais atenção em com que frequência realmente olho os resultados de busca e em quantas vezes só vejo o resumo de IA
Também há partes que não vi no anúncio da Apple. Por exemplo, para programação básica, mencionaram o LLM do Xcode, o app Shortcuts e Safari Extensions, mas eu acabei de pedir para ele criar uma página web para mostrar dados que recebi do Kagi, e o Gemini também conseguiu fazer isso
Talvez a Siri também consiga, mas ainda falta ver, e a experiência importa. O ChatGPT lida muito melhor com o processo de escrever código com uma interface de programação que tem editor ao vivo, enquanto o Kagi parece o ChatGPT de alguns anos atrás, despejando blocos inteiros de código e soltando um novo dump de código toda vez que você pede ajustes
Ir para o Xcode pode ser demais e a Siri pode ser de menos, então pode continuar existindo uma lacuna de uso de IA por prosumers que a Apple não consiga preencher
A Anthropic aparentemente não liga muito para IA de consumo, e consumidores talvez sejam a base de clientes menos lucrativa
A Apple parece mais próxima de aumentar o uso de IA entre consumidores em geral, algo parecido com quando o Instagram adicionou Stories. Isso conteve o crescimento do Snapchat, mas eu teria cautela antes de afirmar que vai tirar muitos usuários da OpenAI
Se você está pagando pelo ChatGPT agora, provavelmente usa para programar por hobby, projetos e geração de imagens, e quem paga mais quase certamente usa em projetos pessoais de programação
Assinantes de mais de US$ 100 por mês não vão sair por causa disso, e também é muito difícil imaginar usuários de US$ 20 por mês abandonando o serviço de forma significativa
A maior parte dos usuários no mundo usa celulares baratos com CPU fraca e pouca RAM, então não dá para rodar localmente modelos realmente úteis
No acordo Google-Apple, não está claro se o Google também está vendendo por esse US$ 1 bilhão acesso à computação em nuvem, ou se só está compartilhando pesos e propriedade intelectual
A própria Apple também disse que haverá limites de uso e upgrades de assinatura para quem quiser usar mais, então isso cria uma frente de competição direta com os laboratórios de IA. Mesmo com um padrão definido, como Safari e Chrome mostram, concorrentes bem-sucedidos ainda são possíveis
O Google, que tem muito caixa, também pode fornecer modelos com desconto abaixo do valor real para eliminar o incentivo econômico de seu principal concorrente bem capitalizado entrar na corrida armamentista de treinamento de modelos fundamentais
Usuários que querem funções sérias além de resumo e ajuste de estilo podem encontrar valor, mesmo com uso ocasional, em uma assinatura razoável ou plano com anúncios de modelos de maior qualidade
A Apple também pode oferecer isso, mas quando se começa a comparar recursos, para muita gente Gemini, Claude e ChatGPT podem acabar sendo opções melhores
E também existe o risco real de a Apple mais uma vez prometer demais e entregar um modelo de baixa qualidade no lançamento, empurrando ainda mais usuários para serviços por assinatura
Isso inclui vida pessoal, interesses, planos, negócios e informações da família, então migrar para outro app de IA é bem doloroso porque seria preciso recomeçar do zero
Um dos sinais que ajudam a identificar um agitador charlatão é falar num tom exaltado do tipo “por que ninguém entende isso?”, mas sem que a lógica realmente se encadeie
Se o argumento do Zitron fosse tão sólido quanto ele diz, quem lê deveria conseguir entendê-lo e ver essa solidez
Seria possível acompanhar se ele partisse das estatísticas de demanda por IA e seguisse com cuidado para a etapa seguinte, como a receita necessária para a lucratividade das empresas de IA, mas ele salta, dá pulos e depois volta
Se a situação fosse realmente tão clara no nível de “como vocês não conseguem ver?”, a explicação também deveria ser clara, mas não é. E não é clara porque a própria situação não é assim tão clara
Em linhas gerais, a mensagem dele é que a indústria de tecnologia está profundamente corrompida em termos morais. É difícil dizer isso sem soar exaltado, mas parece menos um exagero sem base e mais uma incredulidade do tipo “por que ainda investem e trabalham na Meta apesar da quantidade esmagadora de evidências de que é uma empresa que faz coisas horríveis com as pessoas?”
Ainda assim, o que entendi é que as empresas de IA prometeram comprar X de capacidade computacional, data centers estão sendo construídos para atender essa demanda, esses data centers precisam receber Y, mas as empresas de IA não têm receita suficiente para pagar Y
Pessoalmente, isso não me surpreende. Os usos práticos de IA que vi são geração de código e ligações automáticas de vendas ou golpe, e isso não parece um mercado grande o bastante para sustentar os valores gigantescos que estão circulando agora
Fico curioso para saber por que consideram que o Ed errou tanto. Para mim, parece que uma grande correção está chegando para a IA como um todo
Isso não parece o tipo de informação que seria razoável esperar ver repetida e copiada em todo post regular de blog
O tom é sarcástico, mas, se você realmente clicou, eu sinceramente queria saber a resposta
É uma tentativa fraca de imitar o jornalismo moderno de denúncia, tentando ser espirituosa, mas com pouco substance
Isso já foi dito muitas vezes, mas Ed Zitron é alguém em quem é difícil confiar
Pelo que vejo, ele já foi tendencioso e esteve errado até em coisas muito óbvias e triviais, então é difícil aceitar sem reservas uma análise complexa com números e tendências
Por exemplo, lembro de um tuíte de alguns meses atrás em que ele zombava de quem falava de agentes e codificação agentic. Era algo como “Agentes? Que agentes? Vocês sequer sabem do que estão falando?”, e as respostas vieram com centenas de pessoas explicando que de fato usam agentes
Ele tem um público e metas de engajamento, e o objetivo não é informar, mas conseguir cliques
A direção geral pode estar certa. Por exemplo, pode estar certo ao sugerir que a receita necessária para cobrir os gastos parece absurdamente alta, mas parece que ele mistura números para montar um pior cenário que não necessariamente corresponde à realidade
Somando a isso o fato de que ele não demonstra nenhuma abertura em relação a qualquer coisa minimamente ligada à IA, fica difícil levá-lo a sério
Publicações gostam de discursos longos, sombrios e catastróficos, e por isso parece que ele construiu a carreira com textos anti-IA histéricos. Isso não significa que ele esteja certo
A parte mais convincente do texto é que, olhando apenas para os números, o volume de investimento necessário parece insustentável em termos puramente de dólares
Mesmo sem concordar com o autor, dá para acompanhar a lógica. OpenAI, SpaceX e Anthropic precisam abrir capital este ano para evitar ficar sem dinheiro, e já não há capital privado suficiente. O IPO é a última rodada de captação
A IA pode ser muito útil e transformadora, e as empresas podem até crescer rápido, mas talvez não haja dinheiro para sustentar esse crescimento
A parte sobre uma empresa de IA falida ter cancelado um contrato com a Oracle fez a Oracle parecer uma analogia com a Nortel. Se um grande bloco de clientes desaparecer de repente, ela pode ter de fazer baixas contábeis na casa de centenas de bilhões de dólares
Sou profundamente cético em relação aos senhores da IA, mas continuar insistindo que não existe nada ali não é honesto
O Zitron agora está praticamente implorando por um colapso
Ele acertou ao apontar enormes riscos financeiros com uma análise macro, mas, por causa do pessimismo incessante, está deixando completamente passar a utilidade no mundo real do enorme ganho de produtividade que muita gente no HN sente no dia a dia
Neste momento, estou tentando acreditar que existe uma zona intermediária em que essa ampliação da capacidade individual leva a grandes descobertas
Então não faço ideia de para onde toda essa produtividade está indo, onde está o valor, onde estão as estatísticas de desemprego em massa ou os milhões de novas startups ganhando muito dinheiro
Há valor em vozes contrárias, porque um ciclo de hype superaquecido precisa de críticas equilibradas, mas os argumentos dele não são sólidos mesmo que você concorde com as premissas
Minha maior reclamação com a conta aproximada dele é que ele trata a margem bruta de inferência como algo novo e incomparável às margens normais de SaaS
Isso está parcialmente certo. O treinamento de modelos, a construção da infraestrutura associada e a esteira interminável de P&D necessária para manter a competitividade realmente alteram um pouco a análise
Mas dizer que isso é estruturalmente diferente das margens normais de SaaS é exagero. O modelo de negócio não é como o da Dropbox, mas é bastante parecido com a AWS do início, CDNs e operadoras de telecom
Posso falar da área de telecom porque passei mais da metade da minha carreira nela, como engenheiro e fundador: negócios de infraestrutura extremamente intensivos em capital, cuja lucratividade depende de utilização, oversubscription, planejamento de capacidade de pico, segmentação e retorno sobre capex, são perfeitamente possíveis
Com o surgimento de uma segmentação de tarefas explícita para reduzir custos, os cálculos dele ficam ainda mais duvidosos. As organizações mais avançadas estão percebendo que não precisam usar o melhor e mais caro modelo para toda tarefa
Dá para encaminhar tarefas fáceis para modelos baratos, usar cache, processar em lote tarefas não urgentes e reservar os modelos de ponta apenas para algumas tarefas que realmente exigem inteligência de ponta. Isso contradiz frontalmente a afirmação de que os fornecedores precisam perseguir sempre a inteligência de fronteira para sustentar a demanda, a utilização e a curva de preços atuais
Você pode sentir ganho de produtividade sem que valor real esteja sendo criado, e acho que é exatamente isso que os dados mais sólidos mostram
https://unessays.substack.com/p/talk-is-cheap
Existe algum grande estudo revisado por pares ou metaestudo que confirme essa afirmação?
Só o fato de ele nunca ter refletido sobre os fracassos evidentes da própria análise já diz o necessário sobre sua honestidade intelectual
Há verdade em parte do que ele diz sobre risco financeiro, mas, se você não consegue reconhecer também o potencial de alta, não consegue avaliar o risco corretamente
Por isso é difícil levá-lo a sério
Há muitos comentários descartando o texto nesta thread, mas poucos lidam com o conteúdo de fato
A questão central é se “a IA não pode se dar ao luxo de desacelerar — ela precisa de mais de 3 trilhões de dólares em receita até o fim de 2030 para continuar existindo” é verdade
Se a massa salarial total em 2024 foi de 11,7 trilhões de dólares [0], e o emprego não agrícola naquele ano foi de 158.000 [1], então meu cálculo de guardanapo de que a IA precisaria tomar ou criar pelo menos 1 em cada 20 empregos para atingir o ponto de equilíbrio fica uma ordem de grandeza abaixo disso
[0] https://fred.stlouisfed.org/series/BA06RC1A027NBEA
[1] https://fred.stlouisfed.org/series/PAYEMS
Em 2008 e em 2020~2023, uma quantidade enorme de dinheiro entrou na economia, e os ricos ficaram absurdamente mais ricos. Essa riqueza agora está presa à versão dos anos 2020 de ferrovias/fibra óptica, e estamos basicamente tentando apagar trilhões de dólares da economia mundial para reiniciar
Um reset realmente é necessário
Antes de gastar 20 minutos lendo este texto, vale saber que esse autor vem publicando há mais de 2 anos opiniões populares, mas consistentemente erradas, do tipo “a IA está fracassando, é desperdício de dinheiro, é ruim e nunca vai funcionar”
Por exemplo, textos como https://www.wheresyoured.at/peakai/ de março de 2024
Durante 2 anos, essa pessoa claramente parecia louca e perdeu a grande alta do mercado, mas no fim estava certa. Claro, as ações de tecnologia depois se recuperaram lentamente
Prever o timing desse tipo de coisa é notoriamente difícil, e errar por 2 anos não significa que não haverá correção
O Ed é até um pouco interessante como termômetro, mas tenho dificuldade em levar a sério o que ele escreve
O Tim Lee também apontou que, quando o Ed publicou alguns detalhes das análises dele, havia coisas bem estranhas: https://x.com/binarybits/status/2034377838883700953
No instante em que aparece o pop-up para assinar a newsletter, eu fecho a aba na hora
Ed é uma figura interessante
A análise financeira dele sobre a indústria de IA faz sentido do ponto de vista lógico, mas eu não tenho conhecimento suficiente para saber se ela está de fato correta
Só que ele parece estar tão irritado com IA de forma geral que acaba deixando passar áreas óbvias em que os LLMs realmente estão mudando o estado da arte
Programação parece ser um dos principais casos de uso dos LLMs, como Simon Willison apontou recentemente, e mesmo que esse fosse o único caso de uso realmente legítimo, ainda assim seria imensamente útil
Utilidade e lucratividade são coisas diferentes, e acho que é aí que o Ed toca num ponto importante. Até a inferência ficar muito mais barata, essas empresas não vão conseguir dar lucro, e alguns poucos players gigantes pagarão os preços de token de API, mas a maioria não
Se as empresas de IA precisam de dezenas de bilhões de dólares em receita para se sustentar, é 100% irrelevante se 0,5%, 5% ou 50% dessa receita vem de mudar o estado da arte
O importante não é se é transformador ou não, mas sim que essas empresas não vão ter receita para pagar as contas, e se elas não conseguirem, muitas outras empresas também não vão conseguir
Então, com transformação ou sem transformação, continua sendo um castelo de cartas esperando para desmoronar. Para mudar isso, não é preciso mais “transformação”, e sim um conjunto de recursos capaz de multiplicar por várias vezes a base atual de usuários ou elevar os preços em várias vezes
Em certo sentido, isso é até refrescante. Muita gente critica este ou aquele aspecto da IA, mas no fim acrescenta a ressalva de que “mesmo assim, na verdade eu gosto muito de IA e uso todo dia”
Talvez ele esteja tentando evitar a situação em que construtores pragmáticos aparecem em massa nos comentários para entregar nuances calmamente, ou, no linguajar de hoje, em que guerreiros de teclado irritados e cheios de ressentimento aparecem em enxame, e é cansativo ter que atravessar esse tipo de falso equilíbrio
No caso do Zitron, é difícil fazer esse tipo de crítica. Digam o que quiserem, ele não parece ter medo de soar como alguém tomando partido
Essas três posições são completamente distintas. Você pode achar que IA é muito útil e ainda assim não gostar dela porque pode reduzir seu status social, ou gostar da tecnologia mas achar que Sam Altman é desonesto
Mesmo assim, muitos comentaristas anti-IA parecem sentir estranhamente que precisam defender as três teses ao mesmo tempo
O mais engraçado é que, se ela realmente fosse inútil, não haveria necessidade de se importar. O mercado acabaria percebendo a inutilidade, tudo voltaria ao normal e as pessoas de quem eles não gostam perderiam dinheiro
Claro, não acho que eles realmente acreditem que seja inútil. Acho mais provável que estejam preocupados com o impacto disso no próprio prestígio e desejando desesperadamente que um dia todo mundo “desperte” e passe a compartilhar a crença de que LLMs são apenas papagaios estocásticos sem utilidade. Mas as pessoas estão usando isso todos os dias e vendo as melhorias em tempo real
O argumento dele é que, para essas empresas darem lucro, precisariam acontecer coisas muito grandes e sem precedentes antes de 2022. Em linhas gerais, eu concordo, mas acho que essas coisas já vêm acontecendo há alguns anos, então continuarão acontecendo no futuro
Não há absolutamente nenhuma base, além do clima geral, para acreditar que inferência é cara. Pelos dados e pela intuição, as margens são altas
Esse modo de pensar reforça minha crença de que as pessoas, sem saber muito bem do que estão falando, usam “IA não é lucrativa e é cara demais” como uma espécie de catarse diante de avanços enormes
Zitron é um operador cujo negócio é produzir conteúdo, não acertar previsões
Não importa quantas vezes ele e gente parecida digam que o fim chegou; basta acertarem uma vez
Ainda assim, no momento, ele certamente está certo em partes sobre a viabilidade econômica. Ainda não existe um caminho para recuperar esse investimento gigantesco
Na minha visão, a IA vai mudar o mundo de forma radical
Pode piorar, pode melhorar, ou pode ser uma mistura dos dois, mas disso em si eu não duvido
O salto dos LLMs começou há apenas 5 ou 6 anos. Como referência, as ondas de rádio foram descobertas em 1886 e Marconi as usou para comunicação em 1895; telefone e rádio coexistiram por décadas, mas celulares e tecnologia sem fio só realmente decolaram em 1995
A razão de ter demorado tanto não foi que a física das ondas de rádio precisasse de tempo para amadurecer, mas sim que todo o resto necessário para lucrar com isso precisou de tempo
Para mim, LLM é menos IA e mais um bloco de construção. Pode corresponder às ondas de rádio ou ao transistor
Já estamos vendo que é possível conectar LLMs e transformá-los em agentes. Hoje, preço é o principal fator limitante, de forma rígida, para programação e para agentes
Se você só quer Claude Code ou Codex, até que dá, mas há muitas combinações de LLM que a maioria das pessoas nem cogita experimentar. Por exemplo, usar LLMs para mover diálogos de NPCs e a mecânica do mundo em jogos ainda não fecha por causa do custo
Se o preço do hardware de inferência cair e os algoritmos de inferência continuarem melhorando, tenho convicção — e ao mesmo tempo medo — de que veremos coisas difíceis de imaginar hoje
Custo não é o problema. Respostas e cenários consistentes com o contexto têm quantidade limitada, então não há necessidade de um LLM gerar texto em tempo real dentro do jogo
Em vez disso, dá para usar um LLM para criar um enorme corpus de “átomos” como mensagens de diálogo, fragmentos e pistas, e então concatená-los de forma determinística com base na entrada do jogador. Também é possível fazer revisão prévia e vários testes antes da implementação
Para um jogador interagindo no jogo, um sistema assim, dentro do escopo de interações projetado, será funcionalmente difícil de distinguir de texto gerado
As vantagens também são grandes. Se o jogador sair do papel e ficar testando os limites de propósito, as emendas podem aparecer, mas o sistema não é explorável como um LLM
Suspeitar que alguma coisa pode torná-lo melhor, pior, ou ambos — que percepção afiada
Esse papo de “ainda estamos muito no começo” também é estranho. Já tivemos vários anúncios no Super Bowl, empresas que praticamente dominam as notícias de tecnologia fazendo jornalistas repetirem as falas absurdas de CEOs, e quando dizem que a avaliação passou de 1 trilhão de dólares, as pessoas com autoridade para contestar essas finanças parecem só concordar
Construíram data centers de centenas de acres, fecharam contratos de data centers que nem vão se concretizar e pedem dezenas de bilhões de dólares por mês
Estão devorando o silício, e as pessoas estão vendo com os próprios olhos os preços de hardware dobrarem, triplicarem ou mais
Empresas obrigaram funcionários a usar IA e depois recuaram quando os subsídios acabaram e os custos ficaram claros, porque deixou de ser divertido
E, ainda assim, dizem que precisamos de mais tempo, mais atenção, mais gente olhando. Não sei em que parte da história do rádio isso aconteceu
Simulação é entediante
A base do Ed para dizer que “a IA está desacelerando” é o teto de gastos das empresas, em especial o limite de US$ 1.500 por mês por ferramenta por engenheiro na Uber
Eu interpreto a mesma evidência de forma exatamente oposta. Há um ano, a ideia de uma empresa gastar US$ 1.500 por mês por funcionário com ferramentas de IA parecia absurda, e a reação era: o que exatamente alguém faria com IA para custar tudo isso?
Mas aí surgiram agentes de programação e agentes cada vez mais generalistas, e a demanda dos funcionários ficou tão alta que as empresas passaram a impor limites
O mercado total endereçável dessas empresas de IA saltou para US$ 1.500 por mês por trabalhador do conhecimento, então não vejo como isso seria uma desaceleração
Mas, para fechar a conta do retorno sobre o investimento, seria preciso gastar isso ou mais globalmente, e não há chance de orçamentos assim serem aprovados no longo prazo
Empresas gostam de cortar custos, e no momento em que concluírem que há outro caminho para obter o mesmo valor, ou valor melhor, assim como reduzem funcionários sem hesitar, esse tipo de orçamento também desaparece rápido
Ou pode simplesmente sumir por causa da pressão dos acionistas por valor de curto prazo
Ou seja, só usando Claude Code e Cursor já dá facilmente US$ 3.000 por mês e, se Codex também entrar como opção, pode chegar a US$ 4.500
E, como você escreveu no blog, é um teto flexível que dá para ultrapassar se você conseguir justificar