A xAI está ficando mais próxima de um negócio de aluguel de data centers (REIT) do que de um laboratório de fronteira
(martinalderson.com)- Nas últimas semanas, a empresa fechou sucessivamente contratos para alugar grande capacidade de GPUs para Anthropic e Google, passando a se parecer mais com um negócio de locação de infraestrutura do que com uma desenvolvedora de modelos
- Em fevereiro, a xAI se fundiu com a SpaceX, criando uma estrutura em que a receita desses aluguéis passa a entrar diretamente na entidade que deve abrir capital em breve
- Para a Anthropic, o volume chega a US$ 1,25 bi/mês por 300 MW (cerca de 220 mil GPUs); para o Google, US$ 920 mi/mês por 110 mil GPUs; se os contratos durarem 18 meses, é possível recuperar integralmente cerca de US$ 40 bi em custos de construção
- A escassez extrema de GPUs e a capacidade da SpaceX/xAI de construir data centers rapidamente funcionam como a verdadeira vantagem competitiva desses acordos
- Como a capacidade destinada ao modelo próprio Grok está sendo alugada diretamente a concorrentes, cresce a possibilidade de recuo na disputa entre laboratórios de fronteira, algo que se cruza com o sucesso ou fracasso do maior IPO da história da América do Norte
Estrutura dos contratos e contexto da fusão com a SpaceX
- A xAI fechou recentemente parcerias de grande escala para fornecer capacidade de GPUs à Anthropic e ao Google
- Em fevereiro, a xAI se fundiu com a SpaceX, e a receita desses contratos passa diretamente para a entidade que se prepara para abrir capital
- Fala-se na possibilidade de engenharia financeira (financial engineering) visando o IPO da SpaceX, mas há elementos que vão além de simples manobras contábeis
O problema de falta de capacidade da Anthropic
- Nos produtos Claude, há falta severa de capacidade especialmente no início da tarde na Europa e pela manhã nos EUA
- É o horário em que usuários europeus e americanos trabalham ao mesmo tempo, intensificando a disputa por capacidade
- A Anthropic introduziu limites em horários de pico no plano de assinatura
- Uso entre 5h e 11h no horário do Pacífico / 13h e 19h no horário GMT consome mais da cota de uso
- O objetivo é suavizar a demanda entre horários de pico e fora de pico
- Como a demanda cresce rapidamente, apenas deslocá-la de horário tem limites, tornando inevitáveis novas restrições de uso
- Isso é indesejável em um momento em que Google e OpenAI pressionam pela conquista de clientes
Contratos de fornecimento de capacidade da xAI
- No início de maio, a xAI anunciou que daria à Anthropic acesso ao antigo data center Colossus 1, em Memphis
- Com isso, a Anthropic retirou as restrições de uso para assinantes; a estabilidade do serviço ainda é insuficiente, mas a escassez em horários de pico foi temporariamente aliviada
- O contrato com a Anthropic chegou a US$ 1,25 bi por mês para 300 MW de capacidade, algo em torno de 220 mil GPUs
- Na semana passada, o Google também anunciou uma parceria semelhante, de US$ 920 mi por mês para 110 mil GPUs
- Ambos os contratos incluem cláusulas de cancelamento
- Após um período inicial de lock-in, qualquer lado pode cancelar com aviso prévio de 90 dias
Análise de rentabilidade
- À primeira vista, os contratos parecem extremamente rentáveis para a xAI
- Se durarem 18 meses, seria possível recuperar integralmente cerca de US$ 40 bi em capex, mantendo ainda centenas de MW em GPUs
- Isso não inclui opex nem depreciação
- No médio prazo, a escassez de computação provavelmente continuará, o que significa que até mesmo GPUs H100 mais antigas ainda devem seguir muito úteis após 18 meses
-
Estimativa de custo de energia (opex)
- Com 300 MW operando em capacidade total, o consumo anual seria de cerca de 2,6 bilhões de kWh
- Comprando energia da rede no Tennessee, onde a eletricidade industrial é barata (cerca de US$ 0,06/kWh), isso custaria aproximadamente US$ 160 mi por ano
- O Colossus é operado principalmente com turbinas a gás no local; considerando eficiência térmica de ciclo simples de ~10.000 Btu/kWh e gás Henry Hub a ~US$ 3,50/MMBtu, o custo anual de combustível seria de cerca de US$ 90 mi, ainda mais barato
- Comparado aos cerca de US$ 15 bi por ano que a Anthropic paga pelos 300 MW, a energia representa apenas cerca de 1% da receita
Questionamentos sobre os contratos (red flags)
- Elon Musk e a OpenAI estão em disputa judicial intensa, e é possível que o contrato com a Anthropic tenha como objetivo pressionar a OpenAI mais do que gerar retorno comercial
- O Google é um dos principais acionistas da SpaceX, o que cria incentivo para inflar o valor do IPO
- Ainda assim, o ponto central é a escassez extrema de GPUs em grande escala
- Por trás do boom de capex em data centers está o fato de que todos os operadores estão bastante atrasados em seus cronogramas
- Até o principal data center Stargate UAE, da OpenAI, está diretamente ameaçado pelo atual conflito com o Irã; drones iranianos já atingiram outro data center nos Emirados Árabes Unidos
Vantagem competitiva de construção da SpaceX/xAI
- A SpaceX/xAI se destaca por sua capacidade de construir data centers dentro do prazo
- O Colossus 1 inicial foi construído em apenas 122 dias
- As empresas ligadas a Musk têm grande força para planejar, construir e executar rapidamente projetos massivos de infraestrutura
- As hyperscalers também têm experiência, mas construíram em ambientes menos urgentes, e projetos comuns costumam levar anos para serem executados
- O capex só ganhou força de fato nos últimos anos, e muitos projetos ainda devem ficar prontos apenas daqui a vários anos
- Esse é um diferencial competitivo importante da xAI que não pode ser descartado levianamente
A posição do Grok
- Parte relevante da capacidade de data center que seria destinada a treinamento e inferência do Grok está sendo alugada diretamente a concorrentes, deixando o Grok em uma posição ambígua
- Há indícios de um recuo claro na corrida entre laboratórios de fronteira
- Ainda assim, a xAI pode ter superestimado a capacidade necessária, e a demanda de inferência do Grok pode ter ficado muito abaixo do previsto, levando a empresa a monetizar a capacidade ociosa
- O contrato entre a xAI e a Cursor torna a situação ainda mais complexa
- Engenharia financeira, escassez extrema de computação e vantagem competitiva na construção de data centers: os três fatores parecem ser verdade em alguma medida
- O peso de cada um deles deve determinar o sucesso ou fracasso do maior IPO da história da América do Norte
- No conjunto, a xAI parece menos um laboratório de fronteira com um negócio de data center acoplado e mais um REIT de data centers com um laboratório de fronteira acoplado
1 comentários
Comentários do Hacker News
O Google tem 5~6% de participação na SpaceX. Se a SpaceX estiver mirando uma avaliação de US$ 1,77 trilhão, a participação do Google passaria a valer de US$ 88,5 bilhões a US$ 106,2 bilhões
Não sou cético em relação a IA/LLM em si, mas esse tipo de transação circular é muito suspeito, e fico preocupado com o que acontece quando a música parar
Não há GPUs paradas, e em laboratórios de IA de ponta computação se converte diretamente em dinheiro. É verdade que existe alguma transação circular suspeita, mas não acho que este caso se encaixe nisso
Não é um ativo especulativo em que você compra tokens para revendê-los; aqui os tokens são consumidos no momento da inferência
É difícil saber quanto esse acordo realmente aumenta o valuation da SpaceX, e, a menos que o Google vá se desfazer logo de sua participação na SpaceX, mesmo como transação circular isso não faz muito sentido
Não sei se fazer isso com equity em vez de dívida é uma forma de tirar parte do entusiasmo do mercado de IPOs de Anthropic e OpenAI, mas é interessante ver como o mercado vai receber esse novo equity em circulação. Alguém não vai conseguir atingir a meta de captação, e quem abrir capital mais tarde pode acabar ficando com o problema
Até pouco tempo atrás não se dizia que o valuation da SpaceX se baseava em parte nos lucros da Starlink e em uma especulação enorme?
Mas quando se descobre que estão entrando US$ 2,2 bilhões por mês, ou US$ 26 bilhões por ano em nova receita, vindos de Google e Anthropic, a discussão não vai nessa direção e muda para algo como “a tecnologia da xAI não é grande coisa” e “a estrutura Google/SpaceX faz mal para a economia”
Isso é raciocínio motivado. Quando entram novas informações, você deveria atualizar sua conclusão anterior, mas em vez disso estão só procurando outro caminho para reagir negativamente. Pessoas que odeiam Elon/SpaceX estão contaminando completamente a narrativa
A xAI aparentemente concluiu que essa é a melhor forma de extrair valor de seus ativos. E Google e Anthropic claramente acham que conseguem usar esses ativos para gerar mais valor do que o aluguel que pagam à SpaceX
Então isso invalida a lógica especulativa e, ao mesmo tempo, mostra que há um problema no lado tecnológico que era o núcleo dessa especulação
Se você usar tanto o Grok quanto os modelos concorrentes, é difícil contestar o ponto básico de que o Grok não é tão bom quanto os modelos concorrentes. Isso pode ou não ser importante do ponto de vista do negócio
Só que, neste caso, o modelo de negócios convertido muda fundamentalmente a proposta de valor. Não entendo por que a narrativa “uma empresa espacial que ganhava dinheiro com o negócio espacial agora está brincando de revendedora de computação, e isso é bom” seria mais desejável
E também não gosto muito de atacar indiretamente alguma “narrativa” sem realmente refutá-la. Também não está claro quem é “nós” aqui, e parece uma forma de fingir que existe um consenso que na verdade não existe
Agora já sabemos por quanto essas GPUs estão sendo alugadas. O que eu realmente queria saber agora é o custo de insumo da geração de energia
Será que nessas transações a xAI realmente fica com margem suficiente para cobrir os custos de depreciação?
Pelas notas de rodapé, o Colossus opera em grande parte com turbinas a gás próprias no local, e, assumindo eficiência térmica de cerca de 10.000 Btu/kWh em ciclo simples e preço do gás Henry Hub de US$ 3,50/MMBtu, o custo de combustível seria de algo como US$ 90 milhões por ano
Isso é absurdamente barato. Como é que eu entro no negócio de alugar GPU para hyperscalers também?
Isso não é um REIT de data center. Um REIT de data center não vende computação; vende espaço, energia e refrigeração para onde a computação vai
Entendo o que o autor quer dizer. A ideia deve ser que o ativo mais valioso da SpaceX é a capacidade computacional, mas a analogia não é precisa
No momento, a SpaceX está mais para uma holding que reúne basicamente tudo do Elon, exceto a Tesla. Apostar na SpaceX é, portanto, apostar em um conglomerado
Como desenvolveu um LLM, dá para dizer que é um laboratório de IA, mas pela qualidade do modelo não é algo que dê para chamar de fronteira
Cada um tem seus pontos fortes e fracos e, pessoalmente, ainda acho o ChatGPT o melhor, depois Gemini/Claude e depois Grok.
No uso geral, o Grok muitas vezes parece 1–2 gerações atrás dos modelos concorrentes, mas há três coisas de que gosto nele. Primeiro, entendimento de eventos recentes parece ser o melhor. Não sei se é por causa da integração com o X ou por otimização das chamadas de ferramentas no backend, mas quando pergunto sobre algo que está acontecendo agora, os outros modelos muitas vezes têm informação desatualizada ou dão respostas ruins.
Segundo, em questões pessoais, em geral é o que menos bajula. A Anthropic também está indo nessa direção, e ChatGPT e Gemini também estão melhorando, mas os modelos antigos quase nunca falavam negativamente sobre o que eu fazia. Quando preciso de conselho de carreira ou conselho pessoal, gosto do tom das respostas do Grok.
Terceiro, no trabalho há temas que os outros modelos se recusam a tratar. Na empresa anterior havia muitos usuários da área jurídica e, quando era preciso resumir temas específicos em transcrições de depoimentos, a maioria dos modelos recusava, mas o Grok não. Entendo a necessidade de segurança e não culpo os outros provedores, mas há trabalhos profissionais especializados em que um modelo capaz de lidar com temas sensíveis é indispensável.
Em casos como “encontre um repositório no GitHub que fazia $vague_thing em 2017”, o Grok encontra o que eu quero com mais frequência.
Não quero dizer que isso foi intencional, mas na prática foi esse o efeito.
Para isso, vai precisar não de um data center para inferência, mas de um enorme data center para treinamento.
Para quem não estiver familiarizado, REIT significa real estate investment trust, ou seja, um fundo de investimento imobiliário.
Este texto foi transformado em artigo a partir de um comentário[1] do usuário runako no HN dois dias atrás?
Claro que é bem possível que várias pessoas tenham tido a mesma ideia ao mesmo tempo, mas se o autor publicou o texto por conta própria, a ausência de menção parece um pouco grosseira.
[1] https://news.ycombinator.com/threads?id=runako#48426082
A mesma ideia também apareceu num comentário aqui dois dias atrás: https://news.ycombinator.com/item?id=48426082
Agora está muito difícil alcançar OpenAI e Anthropic. O ciclo virtuoso de gerar receita, usar essa receita para comprar mais computação e usar mais computação para treinar modelos mais inteligentes tornou a competição muito mais difícil.
Se já não dá mais para competir nos LLMs de ponta, do ponto de vista da SpaceXAI faz mais sentido ficar do lado de quem fornece computação.
Elon é excelente em hardware, mas na xAI fez demissões em massa ao estilo PayPal Mafia e, como na aquisição do Twitter, logo depois tentou contratar de novo, mas fracassou em reunir engenheiros de software em grande escala.
O acordo de data center veio depois disso. E a pessoa que prometia defender a liberdade de expressão no mundo e sistemas de IA “pró-humanos” agora está vendendo para concorrentes e reduzindo o limite diário de uso do app do próprio Grok por múltiplos de um dígito.
Se você negociar com o homem mais rico do mundo, dá para prever que, apesar de toda a retórica, no fim o dinheiro virá antes de outras considerações. Ainda assim, é uma estratégia interessante.
Para ser justo, em entrevistas do ano passado eles disseram que consideravam hardware o “gargalo”. Mas continuo convencido de que subestimaram os problemas de software. O app tinha muitos problemas e ainda tem muitos problemas.
A xAI é uma empresa verticalmente integrada e foi muito bem na parte de computação. O modelo topo de linha oscila entre o grupo dos melhores e estar 1–2 gerações atrás e, no papel, houve até um momento em que ficou brevemente no topo.
Se amanhã voltar ao topo, eles têm o know-how para escalar. Se Google ou Anthropic concordarem, podem até recomprar os recursos que emprestaram.