6 pontos por GN⁺ 4 시간 전 | 2 comentários | Compartilhar no WhatsApp
Publicidade
  • A infraestrutura de IA generativa precisa gerar mais de US$ 2 trilhões em receita anual de computação de IA até 2030 para justificar os investimentos em datacenters e os compromissos de capacidade computacional
  • Os 190 GW de datacenters planejados representam entre US$ 9,5 trilhões e US$ 15 trilhões, aplicando um custo de US$ 80 bilhões a US$ 100 bilhões por GW, e para viabilizá-los será necessária a emissão anual de dívida de datacenter entre US$ 500 bilhões e US$ 1 trilhão
  • Estima-se que a OpenAI consumirá pelo menos US$ 852 bilhões até o fim de 2030, e a Anthropic precisará atingir a meta de US$ 174 bilhões em receita anual em 2029 para sustentar seus compromissos de computação
  • Após a mudança para a cobrança baseada em tokens, as empresas vêm tendo dificuldade para visualizar os gastos com IA e medir ROI, e Uber, T-Mobile e Brex definiram limites de gasto com tokens por funcionário
  • Atualmente, 89% da receita de startups de IA está concentrada em OpenAI e Anthropic, então será necessária uma demanda anual adicional por computação de IA de pelo menos US$ 250 bilhões para justificar a escala de computação em construção

A IA não pode se dar ao luxo de desacelerar — mais de US$ 3 trilhões em receita serão necessários até o fim de 2030

  • Aplicando diretamente os dados da Sightline Climate, a capacidade planejada de datacenters é de 190 GW; aplicando a declaração de Jensen Huang de US$ 80 bilhões a US$ 100 bilhões por GW, o custo calculado fica entre US$ 9,5 trilhões e US$ 15 trilhões
  • A formulação da Bloomberg sobre uma construção de datacenters de US$ 3 trilhões não bate com esse cálculo, e o capital necessário terá de ser levantado de algum lugar
  • Uma reportagem do Financial Times avaliou que os bancos podem não conseguir absorver a dívida de datacenters, e a emissão atual de cerca de US$ 250 bilhões por ano precisaria subir para US$ 500 bilhões a US$ 1 trilhão por ano para viabilizar a construção real
  • A NVIDIA projeta US$ 1 trilhão em receita até o fim de 2027 e, como 54% da receita vem de três clientes, a receita futura dependerá de poucos clientes e da capacidade de contrapartes levantarem dívida
  • A venda de US$ 85 bilhões em participação pela Google e os planos da Meta de vender participações no valor de dezenas de bilhões de dólares estão ligados ao cenário em que fica mais difícil para hyperscalers levantar dívida

Os compromissos de computação de OpenAI e Anthropic

  • Os compromissos de computação e chips da Anthropic chegaram a US$ 330 bilhões entre Google, Amazon e Microsoft, mais US$ 30 bilhões com a CoreWeave e US$ 15 bilhões com a SpaceX
  • A Anthropic precisará atingir a meta de US$ 174 bilhões em receita anual em 2029 para sustentar esse custo de computação
  • A Anthropic levantou US$ 95 bilhões nas rodadas de fevereiro, abril e maio, mas esse dinheiro e o fluxo de caixa não bastam para cobrir os custos, exigindo pelo menos mais US$ 200 bilhões no ano seguinte
  • A OpenAI deve consumir pelo menos US$ 852 bilhões até o fim de 2030 e assumiu mais de US$ 770 bilhões em compromissos de computação com Microsoft, Amazon, CoreWeave, Cerebras e Oracle
  • A captação de US$ 122 bilhões da OpenAI em março é insuficiente para cobrir os custos, e a empresa precisará de pelo menos mais US$ 250 bilhões até o fim do ano

Cálculo da receita de datacenters e risco para a Oracle

  • A IA generativa e a computação de IA precisam gerar mais de US$ 2 trilhões por ano em receita até 2030; caso contrário, o capex dos datacenters e os pagamentos dos compromissos de Anthropic e OpenAI não se sustentam
  • Aplicando PUE de 1,35 aos 190 GW de datacenters, a carga principal de TI fica em cerca de 140 GW, o que exigiria US$ 1,75 trilhão em receita anual com base em uma cobrança de US$ 12,5 milhões por MW
  • Mesmo que apenas metade da capacidade planejada seja construída, os datacenters ainda precisariam de US$ 875 bilhões em receita anual para não entrarem em falta de recursos
  • OpenAI e Anthropic projetam, respectivamente, US$ 184 bilhões e US$ 174 bilhões em receita em 2029, somando apenas US$ 358 bilhões
  • Se a OpenAI não conseguir ou não quiser bancar a computação da Oracle, a Oracle pode ficar sem caixa; a Oracle está gastando entre US$ 340 bilhões e US$ 700 bilhões em datacenters de 7,1 GW para a OpenAI
Publicidade

O gasto atual com IA não é suficiente

  • O plano da Salesforce de gastar US$ 300 milhões com a Anthropic em 2026 está muito abaixo da escala necessária
  • A soma da demanda atual de computação de todas as empresas de IA no mundo não chega a US$ 100 bilhões, mas em 2030 será necessário dez vezes isso
  • Segundo reportagem do The Information, a concentração da receita de startups de IA em OpenAI e Anthropic chega a {p:89}, ou seja, 89%
  • A taxa anualizada de US$ 37 bilhões em IA da Microsoft é composta principalmente por computação para a OpenAI, e o CEO da Microsoft AI, Mustafa Suleyman, disse que os modelos da Anthropic são caros demais e quer reduzir seu uso na Microsoft a zero
  • Mesmo que Anthropic e OpenAI consumam US$ 500 bilhões por ano em computação, ainda seriam necessários mais de US$ 250 bilhões anuais adicionais em receita de computação para justificar a construção dos datacenters

Cobrança por tokens e incerteza de ROI

  • Não é possível medir o custo e o retorno sobre investimento de tarefas específicas de IA, e as empresas vêm ampliando a adoção de IA sem medir os resultados produzidos
  • Anthropic e OpenAI migraram clientes para cobrança baseada em tokens no primeiro trimestre de 2026 e, em apenas dois a três meses, a incerteza sobre custo de IA e ROI virou tema recorrente na mídia de negócios
  • Em uma pesquisa da KPMG citada pelo Wall Street Journal, a visibilidade dos custos de IA se divide em {b:26,50,22}: 26% total, 50% parcial e 22% nenhuma ou apenas após a cobrança
  • Uma empresa, sem qualquer controle de gastos, consumiu US$ 500 milhões em modelos da Anthropic em um único mês, e a Uber esgotou seu orçamento anual de tokens em apenas um trimestre
  • A Uber limita o gasto com IA a US$ 1.500 por usuário por mês, a T-Mobile impôs temporariamente US$ 2.000 por usuário por mês, e a Brex limitou a US$ 500 por semana para engenheiros e US$ 5 por semana para não engenheiros

Agentes de programação, loops e o problema do resultado

  • Boris Cherny, responsável pelo Claude Code, e Peter Steinberger, evangelista do OpenClaw pertencente à OpenAI, pedem que os usuários projetem loops para agentes
  • Loops são uma forma de fazer o LLM continuar agindo pelo tempo desejado sem que o usuário precise inserir prompts adicionais
  • Em assinaturas subsidiadas, o custo dos erros do modelo fica escondido pelos planos mensais de US$ 20, US$ 100 ou US$ 200, mas quando o usuário paga o custo real, o preço do fracasso aparece sem filtro
  • Isso se conecta a estudos segundo os quais, quanto mais o LLM raciocina, mais alucinações aparecem, enquanto a abordagem por agentes faz o próprio LLM elaborar seus planos
  • A Notion bloqueou o acesso à Anthropic por algumas horas após uma interrupção no serviço da Anthropic, e muitos dos apps gerados por ferramentas de programação com IA não passam de slopware inútil e inseguro

A metáfora da aranha metálica gigante

  • A aranha metálica gigante é um dispositivo de US$ 1 milhão, e cada uso consome US$ 40 mil em combustível, mas ela consegue pegar objetos ou preparar o jantar
  • O mesmo dispositivo tanto pode pegar com precisão uma Diet Coke na geladeira quanto abrir um buraco nela, e o usuário terá de pagar US$ 40 mil independentemente do resultado
  • Graças aos subsídios, o usuário comum vivencia a destruição só de vez em quando, mas as empresas arcam com o custo real e os fabricantes perdem bilhões por ano com treinamento e manutenção
  • Novos recursos ampliam o conjunto de coisas que supostamente podem ser feitas, mas cada funcionalidade adicionada custa centenas de milhões de dólares, e às vezes nem fica claro se de fato houve novo aprendizado
  • Mesmo com um estudo que aponta aumento na capacidade de completar 50% de tarefas de determinado comprimento, a aranha da metáfora continua imprevisível, pode errar a qualquer momento e também agir sem que o usuário peça

A economia circular da IA e a demanda real por produtos

  • A IA generativa tem alto custo de execução do serviço, os principais laboratórios de IA não têm um caminho para a lucratividade, e o custo e o ROI de tarefas baseadas em LLM também não conseguem ser medidos
  • Projetos de IA podem aumentar os custos operacionais de 10% a 100%, e, ao contrário da promessa de custos menores tanto para operadores de serviços de IA quanto para clientes, os custos vêm aumentando
  • Os altos custos mantêm a estrutura em que laboratórios de IA enviam dinheiro para parceiros hyperscalers de computação, e esses recursos circulam de volta para os laboratórios e para a demanda por GPUs da NVIDIA
  • Se OpenAI ou Anthropic buscarem lucratividade ou sustentabilidade, a demanda por computação de IA cairá, assim como a demanda por Azure, Google Cloud, Amazon Web Services, CoreWeave, Oracle Cloud Infrastructure e GPUs da NVIDIA
  • Para que os compromissos e projeções atuais fechem, toda a stack de IA precisa crescer 10 vezes, com mais US$ 250 bilhões por ano em demanda de computação de IA e pelo menos mais duas empresas do porte de OpenAI ou Anthropic
Publicidade

2 comentários

 
mammal 1 시간 전

A API nunca deixou de cobrar com base em tokens...

 
GN⁺ 4 시간 전
Opiniões no Hacker News
  • Hoje a Apple lançou recursos de IA reformulados e, segundo várias reportagens, a Apple estaria operando isso pagando ao Google algo em torno de US$ 1 bilhão por ano
    Na prática, isso parece mais um licenciamento de propriedade intelectual, e o Google aparentemente acha aceitável ceder por esse valor o direito de operar e destilar seus próprios modelos
    Mesmo que a receita de consumo seja só parte do quebra-cabeça inteiro, fica a dúvida de por que usuários de Mac ou iPhone precisariam pagar pelo ChatGPT se a nova IA da Apple já os atender
    O Google também vai colocar ferramentas parecidas nos celulares e continuar oferecendo recursos de IA na busca, então não está claro onde está a evidência de que a IA para consumidores vale para Anthropic ou OpenAI muito mais do que US$ 1 bilhão por ano depois que a tecnologia da Apple existe
    Mesmo que a OpenAI feche um acordo para entrar em celulares Samsung e a Samsung esteja 10 vezes mais desesperada que a Apple, isso daria algo como US$ 10 bilhões por ano, e se a projeção de receita de consumo da OpenAI para 2026 é de US$ 14–15 bilhões, mesmo atingindo isso parece difícil sustentar depois que usuários de iPhone tiverem recursos nativos úteis
    Ed Zitron é mais para um agitador barulhento em estilo britânico, mas no geral parece estar dizendo coisas corretas

    • Provavelmente é pelo mesmo motivo de o app Gemini, mesmo vindo pré-instalado por padrão em celulares Android no mundo todo, ainda ficar muito atrás do ChatGPT em uso e adoção entre consumidores
      Mesmo com botão do Copilot no Windows, as pessoas usam GPT, o Microsoft Edge não é o navegador mais popular no Windows, e o Instagram Threads também não causou um grande impacto no TikTok
      A pergunta está invertida. As pessoas usam o que gostam e têm forte preferência por continuar usando isso
      Não é preciso um fosso gigantesco; o problema aparece quando os usuários continuam insatisfeitos com o produto ou quando existe um concorrente muito melhor de que todo mundo fala
      Se os recursos da Apple não oferecerem uma vantagem significativa sobre simplesmente usar o GPT, é difícil esperar um milagre
    • Estou usando o Kagi Assistant para IA, mas no outono a Siri talvez possa substituí-lo
      A questão que sobra é se vou continuar usando o Kagi por causa da busca ou se a nova Siri vai me levar, de forma geral, a tudo de que eu preciso. Vou precisar prestar mais atenção em com que frequência realmente olho os resultados de busca e em quantas vezes só vejo o resumo de IA
      Também há partes que não vi no anúncio da Apple. Por exemplo, para programação básica, mencionaram o LLM do Xcode, o app Shortcuts e Safari Extensions, mas eu acabei de pedir para ele criar uma página web para mostrar dados que recebi do Kagi, e o Gemini também conseguiu fazer isso
      Talvez a Siri também consiga, mas ainda falta ver, e a experiência importa. O ChatGPT lida muito melhor com o processo de escrever código com uma interface de programação que tem editor ao vivo, enquanto o Kagi parece o ChatGPT de alguns anos atrás, despejando blocos inteiros de código e soltando um novo dump de código toda vez que você pede ajustes
      Ir para o Xcode pode ser demais e a Siri pode ser de menos, então pode continuar existindo uma lacuna de uso de IA por prosumers que a Apple não consiga preencher
    • Quanto à afirmação de que, mesmo se a OpenAI atingir US$ 14–15 bilhões em receita de consumo em 2026, esse seria o último ano, eu aceitaria de bom grado apostar do outro lado com as mesmas odds
      A Anthropic aparentemente não liga muito para IA de consumo, e consumidores talvez sejam a base de clientes menos lucrativa
      A Apple parece mais próxima de aumentar o uso de IA entre consumidores em geral, algo parecido com quando o Instagram adicionou Stories. Isso conteve o crescimento do Snapchat, mas eu teria cautela antes de afirmar que vai tirar muitos usuários da OpenAI
      Se você está pagando pelo ChatGPT agora, provavelmente usa para programar por hobby, projetos e geração de imagens, e quem paga mais quase certamente usa em projetos pessoais de programação
      Assinantes de mais de US$ 100 por mês não vão sair por causa disso, e também é muito difícil imaginar usuários de US$ 20 por mês abandonando o serviço de forma significativa
    • O caminho óbvio para laboratórios de IA conquistarem clientes é via GPU em nuvem
      A maior parte dos usuários no mundo usa celulares baratos com CPU fraca e pouca RAM, então não dá para rodar localmente modelos realmente úteis
      No acordo Google-Apple, não está claro se o Google também está vendendo por esse US$ 1 bilhão acesso à computação em nuvem, ou se só está compartilhando pesos e propriedade intelectual
      A própria Apple também disse que haverá limites de uso e upgrades de assinatura para quem quiser usar mais, então isso cria uma frente de competição direta com os laboratórios de IA. Mesmo com um padrão definido, como Safari e Chrome mostram, concorrentes bem-sucedidos ainda são possíveis
      O Google, que tem muito caixa, também pode fornecer modelos com desconto abaixo do valor real para eliminar o incentivo econômico de seu principal concorrente bem capitalizado entrar na corrida armamentista de treinamento de modelos fundamentais
      Usuários que querem funções sérias além de resumo e ajuste de estilo podem encontrar valor, mesmo com uso ocasional, em uma assinatura razoável ou plano com anúncios de modelos de maior qualidade
      A Apple também pode oferecer isso, mas quando se começa a comparar recursos, para muita gente Gemini, Claude e ChatGPT podem acabar sendo opções melhores
      E também existe o risco real de a Apple mais uma vez prometer demais e entregar um modelo de baixa qualidade no lançamento, empurrando ainda mais usuários para serviços por assinatura
    • Usuários do ChatGPT já colocaram uma quantidade enorme de dados sobre a própria vida e interesses lá dentro
      Isso inclui vida pessoal, interesses, planos, negócios e informações da família, então migrar para outro app de IA é bem doloroso porque seria preciso recomeçar do zero
  • Um dos sinais que ajudam a identificar um agitador charlatão é falar num tom exaltado do tipo “por que ninguém entende isso?”, mas sem que a lógica realmente se encadeie
    Se o argumento do Zitron fosse tão sólido quanto ele diz, quem lê deveria conseguir entendê-lo e ver essa solidez
    Seria possível acompanhar se ele partisse das estatísticas de demanda por IA e seguisse com cuidado para a etapa seguinte, como a receita necessária para a lucratividade das empresas de IA, mas ele salta, dá pulos e depois volta
    Se a situação fosse realmente tão clara no nível de “como vocês não conseguem ver?”, a explicação também deveria ser clara, mas não é. E não é clara porque a própria situação não é assim tão clara

    • Sempre acho meio estranho que as pessoas se concentrem demais no estilo do Ed em vez da mensagem
      Em linhas gerais, a mensagem dele é que a indústria de tecnologia está profundamente corrompida em termos morais. É difícil dizer isso sem soar exaltado, mas parece menos um exagero sem base e mais uma incredulidade do tipo “por que ainda investem e trabalham na Meta apesar da quantidade esmagadora de evidências de que é uma empresa que faz coisas horríveis com as pessoas?”
    • Quando dizem que ele deveria partir das estatísticas e continuar o cálculo até a receita necessária, isso não é exatamente o que a primeira seção com título faz?
    • Eu não leio Ed Zitron fora das vezes em que ele aparece no Hacker News, e posso concordar que o tom dele é exagerado
      Ainda assim, o que entendi é que as empresas de IA prometeram comprar X de capacidade computacional, data centers estão sendo construídos para atender essa demanda, esses data centers precisam receber Y, mas as empresas de IA não têm receita suficiente para pagar Y
      Pessoalmente, isso não me surpreende. Os usos práticos de IA que vi são geração de código e ligações automáticas de vendas ou golpe, e isso não parece um mercado grande o bastante para sustentar os valores gigantescos que estão circulando agora
      Fico curioso para saber por que consideram que o Ed errou tanto. Para mim, parece que uma grande correção está chegando para a IA como um todo
    • Quais dos hyperlinks fornecidos no início pareciam ser o que você queria, e como exatamente você se decepcionou depois de clicar?
      Isso não parece o tipo de informação que seria razoável esperar ver repetida e copiada em todo post regular de blog
      O tom é sarcástico, mas, se você realmente clicou, eu sinceramente queria saber a resposta
    • Expressões como “os jornalistas agora estão obcecados por OpenAI e Anthropic” certamente causam rejeição
      É uma tentativa fraca de imitar o jornalismo moderno de denúncia, tentando ser espirituosa, mas com pouco substance
  • Isso já foi dito muitas vezes, mas Ed Zitron é alguém em quem é difícil confiar
    Pelo que vejo, ele já foi tendencioso e esteve errado até em coisas muito óbvias e triviais, então é difícil aceitar sem reservas uma análise complexa com números e tendências
    Por exemplo, lembro de um tuíte de alguns meses atrás em que ele zombava de quem falava de agentes e codificação agentic. Era algo como “Agentes? Que agentes? Vocês sequer sabem do que estão falando?”, e as respostas vieram com centenas de pessoas explicando que de fato usam agentes
    Ele tem um público e metas de engajamento, e o objetivo não é informar, mas conseguir cliques

    • É interessante que os números dele se baseiem em fontes que ele mesmo disse não considerar confiáveis
      A direção geral pode estar certa. Por exemplo, pode estar certo ao sugerir que a receita necessária para cobrir os gastos parece absurdamente alta, mas parece que ele mistura números para montar um pior cenário que não necessariamente corresponde à realidade
      Somando a isso o fato de que ele não demonstra nenhuma abertura em relação a qualquer coisa minimamente ligada à IA, fica difícil levá-lo a sério
      Publicações gostam de discursos longos, sombrios e catastróficos, e por isso parece que ele construiu a carreira com textos anti-IA histéricos. Isso não significa que ele esteja certo
    • Este texto traz bastante análise quantitativa, então a argumentação ficaria mais forte se houvesse um ou dois exemplos de por que esses números estão errados
      A parte mais convincente do texto é que, olhando apenas para os números, o volume de investimento necessário parece insustentável em termos puramente de dólares
      Mesmo sem concordar com o autor, dá para acompanhar a lógica. OpenAI, SpaceX e Anthropic precisam abrir capital este ano para evitar ficar sem dinheiro, e já não há capital privado suficiente. O IPO é a última rodada de captação
      A IA pode ser muito útil e transformadora, e as empresas podem até crescer rápido, mas talvez não haja dinheiro para sustentar esse crescimento
      A parte sobre uma empresa de IA falida ter cancelado um contrato com a Oracle fez a Oracle parecer uma analogia com a Nortel. Se um grande bloco de clientes desaparecer de repente, ela pode ter de fazer baixas contábeis na casa de centenas de bilhões de dólares
    • Ele chama todo mundo de golpista, mas ele próprio também parece um
      Sou profundamente cético em relação aos senhores da IA, mas continuar insistindo que não existe nada ali não é honesto
  • O Zitron agora está praticamente implorando por um colapso
    Ele acertou ao apontar enormes riscos financeiros com uma análise macro, mas, por causa do pessimismo incessante, está deixando completamente passar a utilidade no mundo real do enorme ganho de produtividade que muita gente no HN sente no dia a dia
    Neste momento, estou tentando acreditar que existe uma zona intermediária em que essa ampliação da capacidade individual leva a grandes descobertas

    • Se você tirar as ações ligadas à IA de qualquer índice, o que sobra? Nada
      Então não faço ideia de para onde toda essa produtividade está indo, onde está o valor, onde estão as estatísticas de desemprego em massa ou os milhões de novas startups ganhando muito dinheiro
    • Pelo menos para mim, ele vem mostrando de forma consistente que não entende muito bem como a inferência funciona tecnicamente, e isso enfraquece a tese central de que um colapso é inevitável
      Há valor em vozes contrárias, porque um ciclo de hype superaquecido precisa de críticas equilibradas, mas os argumentos dele não são sólidos mesmo que você concorde com as premissas
      Minha maior reclamação com a conta aproximada dele é que ele trata a margem bruta de inferência como algo novo e incomparável às margens normais de SaaS
      Isso está parcialmente certo. O treinamento de modelos, a construção da infraestrutura associada e a esteira interminável de P&D necessária para manter a competitividade realmente alteram um pouco a análise
      Mas dizer que isso é estruturalmente diferente das margens normais de SaaS é exagero. O modelo de negócio não é como o da Dropbox, mas é bastante parecido com a AWS do início, CDNs e operadoras de telecom
      Posso falar da área de telecom porque passei mais da metade da minha carreira nela, como engenheiro e fundador: negócios de infraestrutura extremamente intensivos em capital, cuja lucratividade depende de utilização, oversubscription, planejamento de capacidade de pico, segmentação e retorno sobre capex, são perfeitamente possíveis
      Com o surgimento de uma segmentação de tarefas explícita para reduzir custos, os cálculos dele ficam ainda mais duvidosos. As organizações mais avançadas estão percebendo que não precisam usar o melhor e mais caro modelo para toda tarefa
      Dá para encaminhar tarefas fáceis para modelos baratos, usar cache, processar em lote tarefas não urgentes e reservar os modelos de ponta apenas para algumas tarefas que realmente exigem inteligência de ponta. Isso contradiz frontalmente a afirmação de que os fornecedores precisam perseguir sempre a inteligência de fronteira para sustentar a demanda, a utilização e a curva de preços atuais
    • Produtividade não é valor
      Você pode sentir ganho de produtividade sem que valor real esteja sendo criado, e acho que é exatamente isso que os dados mais sólidos mostram
      https://unessays.substack.com/p/talk-is-cheap
    • Se isso é tão inegável assim, fico me perguntando por que não existe nenhuma evidência científica
      Existe algum grande estudo revisado por pares ou metaestudo que confirme essa afirmação?
    • Desde 2024, ele vem prevendo repetidamente que o colapso está logo ali, que o progresso está desacelerando e que não existe mercado de inferência
      Só o fato de ele nunca ter refletido sobre os fracassos evidentes da própria análise já diz o necessário sobre sua honestidade intelectual
      Há verdade em parte do que ele diz sobre risco financeiro, mas, se você não consegue reconhecer também o potencial de alta, não consegue avaliar o risco corretamente
      Por isso é difícil levá-lo a sério
  • Há muitos comentários descartando o texto nesta thread, mas poucos lidam com o conteúdo de fato
    A questão central é se “a IA não pode se dar ao luxo de desacelerar — ela precisa de mais de 3 trilhões de dólares em receita até o fim de 2030 para continuar existindo” é verdade
    Se a massa salarial total em 2024 foi de 11,7 trilhões de dólares [0], e o emprego não agrícola naquele ano foi de 158.000 [1], então meu cálculo de guardanapo de que a IA precisaria tomar ou criar pelo menos 1 em cada 20 empregos para atingir o ponto de equilíbrio fica uma ordem de grandeza abaixo disso
    [0] https://fred.stlouisfed.org/series/BA06RC1A027NBEA
    [1] https://fred.stlouisfed.org/series/PAYEMS

    • Se você acha que existe um pequeno grupo secreto real comandando a economia mundial, isso soa quase como ficção
      Em 2008 e em 2020~2023, uma quantidade enorme de dinheiro entrou na economia, e os ricos ficaram absurdamente mais ricos. Essa riqueza agora está presa à versão dos anos 2020 de ferrovias/fibra óptica, e estamos basicamente tentando apagar trilhões de dólares da economia mundial para reiniciar
      Um reset realmente é necessário
  • Antes de gastar 20 minutos lendo este texto, vale saber que esse autor vem publicando há mais de 2 anos opiniões populares, mas consistentemente erradas, do tipo “a IA está fracassando, é desperdício de dinheiro, é ruim e nunca vai funcionar”
    Por exemplo, textos como https://www.wheresyoured.at/peakai/ de março de 2024

    • Não sei onde ouvi isso, mas me lembra a história de alguém que previu cedo demais o estouro da bolha das pontocom por volta de 1998
      Durante 2 anos, essa pessoa claramente parecia louca e perdeu a grande alta do mercado, mas no fim estava certa. Claro, as ações de tecnologia depois se recuperaram lentamente
      Prever o timing desse tipo de coisa é notoriamente difícil, e errar por 2 anos não significa que não haverá correção
    • Você pode apontar partes específicas daquele texto que mereçam ser chamadas de consistentemente erradas? Não discordo de você, mas, olhando por cima, nada saltou imediatamente aos olhos
    • A qualidade do pessimismo sobre IA está à altura da qualidade do otimismo sobre IA
      O Ed é até um pouco interessante como termômetro, mas tenho dificuldade em levar a sério o que ele escreve
    • Recomendo fortemente ler o perfil da Wired: https://www.wired.com/story/ai-pr-ed-zitron-profile/
      O Tim Lee também apontou que, quando o Ed publicou alguns detalhes das análises dele, havia coisas bem estranhas: https://x.com/binarybits/status/2034377838883700953
    • Neste momento, conteúdo anti-IA parece um pouco reconfortante, então dá vontade de clicar, mas ele continua errando e normalmente insiste na linha de “esses negócios nem dão lucro”
      No instante em que aparece o pop-up para assinar a newsletter, eu fecho a aba na hora
  • Ed é uma figura interessante
    A análise financeira dele sobre a indústria de IA faz sentido do ponto de vista lógico, mas eu não tenho conhecimento suficiente para saber se ela está de fato correta
    Só que ele parece estar tão irritado com IA de forma geral que acaba deixando passar áreas óbvias em que os LLMs realmente estão mudando o estado da arte
    Programação parece ser um dos principais casos de uso dos LLMs, como Simon Willison apontou recentemente, e mesmo que esse fosse o único caso de uso realmente legítimo, ainda assim seria imensamente útil
    Utilidade e lucratividade são coisas diferentes, e acho que é aí que o Ed toca num ponto importante. Até a inferência ficar muito mais barata, essas empresas não vão conseguir dar lucro, e alguns poucos players gigantes pagarão os preços de token de API, mas a maioria não

    • Não acho que a questão de os LLMs realmente mudarem o estado da arte tenha relação com o que ele escreveu
      Se as empresas de IA precisam de dezenas de bilhões de dólares em receita para se sustentar, é 100% irrelevante se 0,5%, 5% ou 50% dessa receita vem de mudar o estado da arte
      O importante não é se é transformador ou não, mas sim que essas empresas não vão ter receita para pagar as contas, e se elas não conseguirem, muitas outras empresas também não vão conseguir
      Então, com transformação ou sem transformação, continua sendo um castelo de cartas esperando para desmoronar. Para mudar isso, não é preciso mais “transformação”, e sim um conjunto de recursos capaz de multiplicar por várias vezes a base atual de usuários ou elevar os preços em várias vezes
    • Talvez ele tenha assinantes e tenha descoberto que essa postura funciona bem com eles
      Em certo sentido, isso é até refrescante. Muita gente critica este ou aquele aspecto da IA, mas no fim acrescenta a ressalva de que “mesmo assim, na verdade eu gosto muito de IA e uso todo dia”
      Talvez ele esteja tentando evitar a situação em que construtores pragmáticos aparecem em massa nos comentários para entregar nuances calmamente, ou, no linguajar de hoje, em que guerreiros de teclado irritados e cheios de ressentimento aparecem em enxame, e é cansativo ter que atravessar esse tipo de falso equilíbrio
      No caso do Zitron, é difícil fazer esse tipo de crítica. Digam o que quiserem, ele não parece ter medo de soar como alguém tomando partido
    • Certos tipos de pessoas parecem incapazes de separar três coisas: 1) não gostam da tecnologia de IA, 2) não gostam das pessoas e empresas que ganham dinheiro com IA, 3) acham que IA é inútil
      Essas três posições são completamente distintas. Você pode achar que IA é muito útil e ainda assim não gostar dela porque pode reduzir seu status social, ou gostar da tecnologia mas achar que Sam Altman é desonesto
      Mesmo assim, muitos comentaristas anti-IA parecem sentir estranhamente que precisam defender as três teses ao mesmo tempo
      O mais engraçado é que, se ela realmente fosse inútil, não haveria necessidade de se importar. O mercado acabaria percebendo a inutilidade, tudo voltaria ao normal e as pessoas de quem eles não gostam perderiam dinheiro
      Claro, não acho que eles realmente acreditem que seja inútil. Acho mais provável que estejam preocupados com o impacto disso no próprio prestígio e desejando desesperadamente que um dia todo mundo “desperte” e passe a compartilhar a crença de que LLMs são apenas papagaios estocásticos sem utilidade. Mas as pessoas estão usando isso todos os dias e vendo as melhorias em tempo real
    • É bem provável que o custo de inferência caia bastante
      O argumento dele é que, para essas empresas darem lucro, precisariam acontecer coisas muito grandes e sem precedentes antes de 2022. Em linhas gerais, eu concordo, mas acho que essas coisas já vêm acontecendo há alguns anos, então continuarão acontecendo no futuro
    • A afirmação de que inferência é cara se repete com frequência, mas na maioria das vezes vem da ignorância
      Não há absolutamente nenhuma base, além do clima geral, para acreditar que inferência é cara. Pelos dados e pela intuição, as margens são altas
      Esse modo de pensar reforça minha crença de que as pessoas, sem saber muito bem do que estão falando, usam “IA não é lucrativa e é cara demais” como uma espécie de catarse diante de avanços enormes
  • Zitron é um operador cujo negócio é produzir conteúdo, não acertar previsões
    Não importa quantas vezes ele e gente parecida digam que o fim chegou; basta acertarem uma vez
    Ainda assim, no momento, ele certamente está certo em partes sobre a viabilidade econômica. Ainda não existe um caminho para recuperar esse investimento gigantesco

    • Se o objetivo é produzir conteúdo, nem sequer é preciso acertar uma única vez
  • Na minha visão, a IA vai mudar o mundo de forma radical
    Pode piorar, pode melhorar, ou pode ser uma mistura dos dois, mas disso em si eu não duvido
    O salto dos LLMs começou há apenas 5 ou 6 anos. Como referência, as ondas de rádio foram descobertas em 1886 e Marconi as usou para comunicação em 1895; telefone e rádio coexistiram por décadas, mas celulares e tecnologia sem fio só realmente decolaram em 1995
    A razão de ter demorado tanto não foi que a física das ondas de rádio precisasse de tempo para amadurecer, mas sim que todo o resto necessário para lucrar com isso precisou de tempo
    Para mim, LLM é menos IA e mais um bloco de construção. Pode corresponder às ondas de rádio ou ao transistor
    Já estamos vendo que é possível conectar LLMs e transformá-los em agentes. Hoje, preço é o principal fator limitante, de forma rígida, para programação e para agentes
    Se você só quer Claude Code ou Codex, até que dá, mas há muitas combinações de LLM que a maioria das pessoas nem cogita experimentar. Por exemplo, usar LLMs para mover diálogos de NPCs e a mecânica do mundo em jogos ainda não fecha por causa do custo
    Se o preço do hardware de inferência cair e os algoritmos de inferência continuarem melhorando, tenho convicção — e ao mesmo tempo medo — de que veremos coisas difíceis de imaginar hoje

    • Na verdade, é exatamente nesse problema que estou trabalhando
      Custo não é o problema. Respostas e cenários consistentes com o contexto têm quantidade limitada, então não há necessidade de um LLM gerar texto em tempo real dentro do jogo
      Em vez disso, dá para usar um LLM para criar um enorme corpus de “átomos” como mensagens de diálogo, fragmentos e pistas, e então concatená-los de forma determinística com base na entrada do jogador. Também é possível fazer revisão prévia e vários testes antes da implementação
      Para um jogador interagindo no jogo, um sistema assim, dentro do escopo de interações projetado, será funcionalmente difícil de distinguir de texto gerado
      As vantagens também são grandes. Se o jogador sair do papel e ficar testando os limites de propósito, as emendas podem aparecer, mas o sistema não é explorável como um LLM
    • Dizer que “a IA pode mudar o mundo para melhor, para pior, ou para ambos” é uma afirmação sem valor
      Suspeitar que alguma coisa pode torná-lo melhor, pior, ou ambos — que percepção afiada
      Esse papo de “ainda estamos muito no começo” também é estranho. Já tivemos vários anúncios no Super Bowl, empresas que praticamente dominam as notícias de tecnologia fazendo jornalistas repetirem as falas absurdas de CEOs, e quando dizem que a avaliação passou de 1 trilhão de dólares, as pessoas com autoridade para contestar essas finanças parecem só concordar
      Construíram data centers de centenas de acres, fecharam contratos de data centers que nem vão se concretizar e pedem dezenas de bilhões de dólares por mês
      Estão devorando o silício, e as pessoas estão vendo com os próprios olhos os preços de hardware dobrarem, triplicarem ou mais
      Empresas obrigaram funcionários a usar IA e depois recuaram quando os subsídios acabaram e os custos ficaram claros, porque deixou de ser divertido
      E, ainda assim, dizem que precisamos de mais tempo, mais atenção, mais gente olhando. Não sei em que parte da história do rádio isso aconteceu
    • Tenho muito mais interesse em diálogos e personagens escritos por autores do que em diálogos de NPC movidos por LLM
      Simulação é entediante
  • A base do Ed para dizer que “a IA está desacelerando” é o teto de gastos das empresas, em especial o limite de US$ 1.500 por mês por ferramenta por engenheiro na Uber
    Eu interpreto a mesma evidência de forma exatamente oposta. Há um ano, a ideia de uma empresa gastar US$ 1.500 por mês por funcionário com ferramentas de IA parecia absurda, e a reação era: o que exatamente alguém faria com IA para custar tudo isso?
    Mas aí surgiram agentes de programação e agentes cada vez mais generalistas, e a demanda dos funcionários ficou tão alta que as empresas passaram a impor limites
    O mercado total endereçável dessas empresas de IA saltou para US$ 1.500 por mês por trabalhador do conhecimento, então não vejo como isso seria uma desaceleração

    • Talvez isso funcione em alguns estados onde as big techs americanas pagam salários absurdos a engenheiros
      Mas, para fechar a conta do retorno sobre o investimento, seria preciso gastar isso ou mais globalmente, e não há chance de orçamentos assim serem aprovados no longo prazo
      Empresas gostam de cortar custos, e no momento em que concluírem que há outro caminho para obter o mesmo valor, ou valor melhor, assim como reduzem funcionários sem hesitar, esse tipo de orçamento também desaparece rápido
      Ou pode simplesmente sumir por causa da pressão dos acionistas por valor de curto prazo
    • Na prática, nem é US$ 1.500 por mês por engenheiro, e sim US$ 1.500 por mês por ferramenta por engenheiro
      Ou seja, só usando Claude Code e Cursor já dá facilmente US$ 3.000 por mês e, se Codex também entrar como opção, pode chegar a US$ 4.500
      E, como você escreveu no blog, é um teto flexível que dá para ultrapassar se você conseguir justificar