- A bolha de investimento no setor de IA já se formou e pode estourar mais cedo do que o esperado devido ao descompasso entre produtividade e rentabilidade
- As big techs estão travando uma disputa de gastos de capital em escala recorde para preservar sua vantagem competitiva, mas há grande chance de que a execução real desses gastos diminua
- Com alta dos custos de energia, variação nos preços de RAM e bloqueio de capital do Oriente Médio, a pressão financeira sobre os laboratórios de IA se intensifica, e alguns já respondem com aumento de preços para usuários
- A OpenAI enfrenta limites de monetização, o que alimenta discussões sobre a adoção de anúncios e até uma possível venda, enquanto uma tentativa de aquisição pela Microsoft traria o risco de enfraquecer a justificativa de sua valorização em bolsa
- Esse movimento pode levar a queda das valuations de mercado, aperto no capital de VC e redução da demanda por datacenters e GPUs, recriando o ciclo de boom e recessão em todo o setor de IA
Sinais prévios do colapso da bolha de IA
- Os gatilhos para o colapso do setor de IA já estão formados e podem se materializar mais cedo do que o previsto
- A tecnologia de IA em si continuará existindo, mas ganho de produtividade e retorno sobre o investimento são questões distintas
- A tecnologia pode aumentar a eficiência da sociedade, mas pode perder atratividade como ativo de investimento
A estratégia das big techs: não vitória, mas corrida de gastos
- As empresas do grupo Magnificent 7 planejam um volume recorde de capex (capital expenditure), numa medida defensiva para se diferenciar de concorrentes e laboratórios de IA
- Por exemplo, se uma empresa investir US$ 50 bilhões, OpenAI e Anthropic precisarão captar US$ 100 bilhões para competir
- Quanto maior o volume necessário, menor o número de fundos capazes de sustentá-lo, e especialmente o capital do Oriente Médio tornou-se difícil de acessar por razões geopolíticas
- Por esse motivo, a corrida das empresas de IA ao IPO está se acelerando, funcionando como principal meio de manter a entrada de recursos
- A Google está em posição favorável graças à sua capacidade de gestão de capital no longo prazo
- Ela pode não executar imediatamente o capex divulgado e injetar recursos gradualmente até que rivais enfrentem dificuldades de financiamento
- Depois, se os concorrentes desistirem, poderá reduzir os gastos e dominar o mercado
- A Alphabet tem valor de mercado de cerca de US$ 2 trilhões, algo como 10 vezes o maior grupo do setor de defesa
- Como resultado, o capex real das empresas da Mag 7, especialmente o da Google, pode acabar sendo menor do que o previsto, o que pode ser visto positivamente pelos investidores
- A Apple busca uma via alternativa, conectando modelos externos de IA pagos ao Siri em vez de competir diretamente; a Amazon diversifica risco com seu investimento na Anthropic, e a Meta segue com gastos em grande escala
Fatores catalisadores: alta de custos e aperto no financiamento
- Os laboratórios de IA enfrentam uma combinação de fatores negativos, como disparada nos custos de energia, bloqueio de capital do Oriente Médio, temor de alta de juros e forte queda nos preços de RAM
- A queda nos preços de RAM estaria ligada à tecnologia TurboQuant AI da Google, que permite que modelos de próxima geração precisem de menos memória, enquanto os laboratórios já firmaram contratos de compra em massa a preços elevados
- A Anthropic está ajustando limites de uso para reduzir custos e elevar receita, e se o capital de investimento secar, será inevitável repassar os custos aos usuários
- Segundo um relatório independente, o custo real de uso do modelo Claude seria cerca de 5 vezes o valor da assinatura, deixando a rentabilidade incerta
- O aumento de preços pode levar à queda da demanda, enfraquecendo a narrativa de crescimento
- Mesmo com aumento de receita, crescimento sem lucro acelera o consumo de caixa
- Grandes empresas de nuvem podem oferecer funcionalidades de IA em modelo loss leader, absorvendo prejuízo para sustentar o pacote, o que enfraquece a competitividade de preço dos laboratórios independentes
- Os planos Claude Max e Max 5x (US$ 100 e US$ 200 por mês, respectivamente) não permitem pagamento anual, o que sugere futuras altas de preço
Os limites de monetização da OpenAI
- A OpenAI tem dificuldades para gerar receita e recorre ao último recurso de introduzir anúncios no ChatGPT
- Trata-se de um método que o CEO Sam Altman já havia descrito no passado como “a última opção”
- Em contrapartida, a Anthropic garante maior rentabilidade no mercado corporativo e entre desenvolvedores
- A função de compras fracassou, e o app de vídeos curtos Sora foi encerrado para reduzir custos
- Levanta-se a possibilidade de uma venda da OpenAI em um futuro próximo
- A compradora mais provável seria a Microsoft, que já detém uma participação relevante
- No entanto, adquirir a OpenAI exigiria US$ 613 bilhões, cerca de 22% do valor de mercado da Microsoft, e não está claro se os acionistas aprovariam
- Mesmo que a Microsoft avance com a aquisição, haveria o risco de enfraquecimento da justificativa da ação com o colapso da narrativa de crescimento da IA
- Se a OpenAI fracassar, a Microsoft perde um cliente importante de nuvem, e a IA que ela própria apoiou também pode canibalizar produtos centrais como o GitHub
Impactos no mercado e nas pessoas
- A crise de financiamento dos grandes laboratórios de IA pode atingir diretamente os demonstrativos financeiros e as perspectivas de crescimento de empresas de capital aberto
- Isso pode levar a queda generalizada das valuations, desaceleração de M&A e aperto no capital de VC
- Há possibilidade de repetição de um ciclo de retração dos investimentos semelhante ao de 2022
- Fundos de pensão e investimentos em datacenters também seriam afetados
- Se o treinamento de novos modelos for interrompido, a demanda por GPUs cai e surge capacidade ociosa
- Algumas GPUs podem nem ser entregues, ou sequer chegar a ser produzidas
- Isso pode representar um golpe severo para a Nvidia
- Mesmo que os datacenters entrem em operação, talvez precisem oferecer serviços por preços menores do que o esperado, numa estrutura em que usuários de IA se beneficiam, mas operadores arcam com prejuízos
- Datacenters costumam ser considerados ativos seguros e são frequentemente construídos com empréstimos bancários, mas uma queda de valor pode levar a reconhecimento de perdas pelos bancos e redução de crédito
- Alguns bancos podem voltar a sofrer pressão de liquidação, como ocorreu em 2023
- Se houver ainda interrupções na manufatura em Taiwan ou desorganização da cadeia de suprimentos, a situação pode piorar ainda mais
- Ainda assim, existe a possibilidade de que a demanda por modelos supere as expectativas e compense todos esses problemas
- No entanto, a maioria das inovações tecnológicas passou por ciclos de boom e recessão, e a IA provavelmente não será exceção
2 comentários
É o post anual sobre WWE, né..
Comentários do Hacker News
O artigo afirma que “os preços de RAM estão despencando”, mas na prática isso não está acontecendo
Olhando a tendência de preços de memória no PCPartPicker, ainda não houve queda, e o artigo do Google sobre TurboQuant também só menciona a possibilidade de reduzir os requisitos de RAM
Acho irresponsável construir toda a tese com base nisso. Não é diferente de um LLM citando links sem sentido
O anúncio do Google não tem nada de novo, e o próprio TurboQuant é uma tecnologia de 1 ano atrás
Mesmo que o preço comercial caia, isso só chega ao mercado comum bem depois
Eu mesmo já vi vários casos assim
Na prática, a queda das ações está correta, como mostra este artigo do FT
É surpreendente como o boom da IA está tão polarizado
A tecnologia em si é claramente um salto incremental importante, mas ninguém sabe para onde isso vai
O custo de fornecer tokens já está em um nível rentável há mais de um ano; o problema é P&D e capex
Os datacenters ainda estão com demanda acima da oferta. Não é uma estrutura sustentada por salários irreais como no passado, e sim um mercado com demanda real
Não no sentido antigo de “substituir humanos”, mas de criar um novo mercado
Ainda assim, se a qualidade não acompanhar, isso também pode virar bolha
É impreciso tratar a adoção de anúncios pela OpenAI como “fracasso de monetização”
Anúncios são apenas uma estratégia para a versão gratuita, e não fazem parte dos planos pagos
Startups operarem no prejuízo durante a fase de crescimento é um fenômeno comum do ciclo de VC
Inferência, ao contrário, tem alta rentabilidade, e faz sentido investir em P&D
TV e YouTube também começaram assim
Um modelo sustentado por subsídio de VC é inviável no longo prazo
Se já é uma empresa de dezenas de bilhões de dólares, agora precisa virar lucrativa
A própria operação de GPUs já é deficitária, e até datacenters têm dificuldade para dar lucro
O uso de LLM explodiu, mas onde está o impacto social disso?
Eu esperava ver aumentos visíveis na App Store, Steam, GitHub, PyPI etc.
Também esperava ganhos em produtividade empresarial, desempenho educacional e até crescimento do PIB, mas não sinto isso
Pessoalmente acho uma ferramenta útil, mas o efeito macroeconômico ainda não apareceu
A IA acelerou a escrita de código, mas os processos de planejamento, gestão e feedback ficaram mais confusos
Eu mesmo estou desenvolvendo um jogo indie, e com IA fiquei de 2 a 4 vezes mais rápido, mas ainda devo levar 1 ano
A afirmação de que “fornecer tokens é rentável” em geral depende de contabilidade maquiada
Na prática, o problema é o custo de treinar a próxima geração de modelos
Provedores independentes já oferecem modelos parecidos por preços bem menores
A receita cresce, mas os custos aumentam na mesma proporção, então não existe economia de escala
Pelos dados da OpenRouter, a margem seria algo como 90%
Talvez dê lucro olhando só para usuários de chat simples, mas a maior parte do uso total não é isso
Como a assinatura custa muito menos que a API, no fim terão de aumentar o preço ou encerrar isso
É difícil confiar no que dizem executivos de empresas de IA
Há quem ache que o mercado de IA não será de o vencedor leva tudo
O ChatGPT tem forte reconhecimento de marca, mas o custo de trocar de modelo é quase zero
Engenheiros já usam vários modelos em paralelo e, se o preço subir, trocam imediatamente
Para empresas, pode até sair mais barato comprar GPUs e fazer self-hosting
É preciso usar os pontos fortes e fracos de cada um conforme a situação
Quando esse mercado abrir, a oportunidade será muito maior do que agora
Agora a diferença de qualidade entre modelos é pequena, então a maioria dos usuários deve usar múltiplos modelos
Chamar os produtos da Microsoft de “péssimos” é exagerado
Produtos como Word são resultado de décadas de trabalho dos melhores engenheiros
Também incomoda empurrarem recursos de IA
Na prática, quase não há motivo para usar Word
O Office talvez sobreviva por muito tempo só trocando de nome
Como diz a frase “a história não se repete”, talvez desta vez não venha um inverno da IA
Diferentemente dos anos 90, agora não existe tecnologia substituta, e a IA representa um salto técnico claro
O ponto central é: “a IA vai continuar, mas retorno sobre investimento é outra questão”
O mesmo valeu para a bolha ferroviária — a tecnologia ficou, só a bolha desapareceu
A situação dos datacenters está confusa
A maioria dos centros anunciados em 2024 ainda nem foi concluída,
e a velocidade de implantação é muito mais lenta do que a produção da Nvidia
Há muitos equipamentos que nem conseguem operar por falta de energia, e o “dark silicon” está se acumulando
Enquanto isso, os consumidores ainda não conseguem comprar produtos por preços razoáveis
O fato de as “Magnificent 7” aumentarem tanto o capex é uma medida defensiva
Mas o autor não explica por que isso seria uma ameaça para OpenAI ou Anthropic
Parece apenas um texto superficial, feito para gerar compartilhamentos
Ainda assim, no longo prazo talvez nem seja necessário ir tão longe