1 pontos por GN⁺ 2 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • HBM subiu de 52% no 1º trimestre de 2024 para 63% no 4º trimestre de 2025 com base na média ponderada por volume de produção dos chips de IA da Nvidia, AMD, Google e Amazon
  • No mesmo período, a participação dos dies lógicos ficou quase estável em cerca de 13%, enquanto o empacotamento avançado caiu de 19% para 15% e os componentes auxiliares de 15% para 9%
  • O gasto com HBM das quatro empresas de design aumentou de cerca de US$ 12 bilhões em 2024 para US$ 32 bilhões em 2025, crescendo ano a ano mais rápido do que os demais componentes
  • O gasto total com componentes de chips de IA subiu de cerca de US$ 22 bilhões para US$ 52 bilhões, e só a HBM respondeu por cerca de US$ 20 bilhões do aumento
  • Em 2026, a pressão de custos pode aumentar ainda mais com a escassez de memória e a alta de preços, e Microsoft e Meta também apontaram o aumento no preço de componentes como fator para a alta dos investimentos em capital

Mudança principal

  • A participação da memória de alta largura de banda (HBM) nos gastos com componentes de chips de IA subiu de 52% no 1º trimestre de 2024 para 63% no 4º trimestre de 2025
  • Essa estimativa é uma média ponderada por volume de produção de todos os chips de IA projetados por Nvidia, AMD, Google e Amazon
  • No mesmo período, os dies lógicos ficaram praticamente inalterados em cerca de 13%, o empacotamento avançado caiu de 19% para 15% e os componentes auxiliares recuaram de 15% para 9%
  • O gasto com HBM das quatro empresas de design aumentou de cerca de US$ 12 bilhões em 2024 para US$ 32 bilhões em 2025, com crescimento ano a ano mais rápido do que o dos outros componentes
  • O gasto total com componentes de chips de IA cresceu de cerca de US$ 22 bilhões em 2024 para cerca de US$ 52 bilhões em 2025, e só o gasto com HBM respondeu por cerca de US$ 20 bilhões do aumento

Pressão de custos em 2026

Método de cálculo e escopo dos dados

  • Para cada chip de IA projetado por Nvidia, AMD, Google e Amazon, foi estimado o custo por chip de memória, die lógico, empacotamento avançado e componentes auxiliares
  • Multiplicando o custo dos componentes de cada chip pelo volume de produção trimestral estimado, foi calculado o gasto total com componentes por categoria, e então a participação sobre o gasto total entre o 1º trimestre de 2024 e o 4º trimestre de 2025
  • As estimativas de custo dos componentes foram obtidas no AI Chip Components explorer, que monta especificações de componentes por chip com base em divulgações financeiras, materiais de fornecedores e relatórios de analistas
  • A metodologia detalhada pode ser consultada na documentação metodológica do explorer

Categorias de componentes

  • Memória

    • Inclui pilhas de HBM, abrangendo HBM3 e HBM3e
  • Lógica

    • Inclui dies lógicos de processos avançados de 3~5nm
  • Empacotamento

    • Inclui o empacotamento avançado CoWoS da TSMC
  • Componentes auxiliares

    • Inclui substratos, fornecimento de energia e outros elementos de entrada que não são lógica nem memória

Tratamento da incerteza

  • incerteza de custo no custo unitário de cada componente, como preço de pilhas de HBM, preço de dies lógicos e preço de pacotes CoWoS
  • Os custos por componente de cada chip foram modelados com intervalo de confiança de 90%
  • Como a participação de um componente é o custo desse componente dividido pelo custo total, tanto o numerador quanto o denominador são incertos
  • Dois tipos de faixa são apresentados em conjunto
    • Faixa em que varia apenas o custo desse componente: a participação quando o custo desse componente está no 5º ou no 95º percentil, enquanto os outros três componentes permanecem na mediana
    • Faixa em que todos os componentes variam para valores extremos: a participação quando esse componente está em um extremo do intervalo de confiança e todos os demais componentes estão simultaneamente no extremo oposto

Participação trimestral dos componentes

  • 1º trimestre de 2024

    • A participação da memória foi de 52%, com faixa de 48~56% quando só o custo desse componente varia e de 42~62% quando todos os componentes variam para valores extremos
    • A participação da lógica foi de 14%, com faixa de 12~17% quando só o custo desse componente varia e de 10~20% quando todos os componentes variam para valores extremos
    • A participação do empacotamento foi de 19%, com faixa de 14~24% quando só o custo desse componente varia e de 12~27% quando todos os componentes variam para valores extremos
    • A participação dos componentes auxiliares foi de 15%, com faixa de 13~18% quando só o custo desse componente varia e de 11~21% quando todos os componentes variam para valores extremos
  • 4º trimestre de 2025

    • A participação da memória foi de 63%, com faixa de 60~67% quando só o custo desse componente varia e de 54~73% quando todos os componentes variam para valores extremos
    • A participação da lógica foi de 13%, com faixa de 10~16% quando só o custo desse componente varia e de 9~19% quando todos os componentes variam para valores extremos
    • A participação do empacotamento foi de 15%, com faixa de 11~19% quando só o custo desse componente varia e de 9~22% quando todos os componentes variam para valores extremos
    • A participação dos componentes auxiliares foi de 10%, com faixa de 8~10% quando só o custo desse componente varia e de 7~12% quando todos os componentes variam para valores extremos

Premissas e limitações

  • Os custos dos componentes podem variar conforme contrato, fornecedor e momento, então há incerteza nas estimativas de custo por chip
  • Também há incerteza nas estimativas de volume de produção trimestral e na composição por tipo de chip, e essa incerteza está refletida nas participações reportadas

Dados e ferramenta de exploração

1 comentários

 
GN⁺ 2 시간 전
Comentários do Hacker News
  • Inferência e treinamento de IA parecem ter um caminho para reduzir os custos de hardware em cerca de 3x e os custos totais em cerca de 2x, mesmo sem nenhuma inovação tecnológica
    Basta que a oferta de DRAM alcance a demanda; seja via expansão da fabricação ou atendendo o pico de demanda no ritmo atual de produção, é apenas uma questão de tempo

    • Considerando até a margem da Nvidia inflada pela escassez atual de chips de ponta, a margem para reduzir custos pode ser muito maior
      Há muita coisa a criticar nas frases que Sam Altman espalhou culturalmente, mas no longo prazo a ideia de que “agora é o pior momento de todos os que virão” me parece um ponto bem interessante e subestimado
      Daqui a 10 anos, treinar LLMs no nível atual provavelmente será algo tão básico quanto operar bancos de dados hoje. O nível atual já é bastante sofisticado, e independentemente dos avanços de hardware, só de criar sistemas de treinamento por aprendizado por reforço melhores já parece haver muito espaço para subir mais
      Recomendo muito olhar os projetos do Allen Institute no GitHub e no HF. Há materiais open source para treinamento, incluindo recursos para treinar LLMs do zero com Common Crawl e ajustes interessantes do qwen, então dá para ter um gostinho de como serão projetos de tarde ou materiais educacionais em breve
    • As fabricantes de memória não vão aumentar fortemente a oferta para acompanhar a demanda
      Esse setor tende a manter o mercado em estado de escassez de oferta, porque caso contrário o excesso de oferta posterior destrói as empresas. Em vez disso, a oferta só será realocada de áreas menos lucrativas, como mobile e computação pessoal, para áreas mais rentáveis
    • Parece que a jogada elegante com que Sam Altman tentou dominar o mercado de memória produziu consequências inesperadas
    • Fico curioso se a adoção de formatos de ponto flutuante alternativos vai aumentar
      Ponto flutuante IEEE é notoriamente ruim em larguras de bits baixas, especialmente 16 bits ou menos. Formatos como posit são muito melhores em 16 bits ou 8 bits. Se for possível treinar com 16 bits em vez de 32 por valor e com perda de precisão muito menor do que na transição de IEEE32 para IEEE16, isso seria bastante relevante
    • Fico me perguntando qual é a vida útil e a possibilidade de recondicionamento de componentes de capital como módulos de “GPU” ou a DRAM soldada neles
  • Alguns anos atrás comprei 96GB de RAM por cerca de 250 dólares, e hoje a mesma RAM custa 1.200 dólares

    • Em 22 de outubro do ano passado comprei um kit Crucial 96GB DDR5 5600MHz SO-DIMM RAM por 279 dólares
      Na Amazon, o mesmo kit está agora por 1.048,90 dólares
    • Fico muito irritado por não ter enchido meu servidor principal até o limite quando tive a chance
      Módulos de memória enterprise usados estavam realmente a preço de banana no eBay
    • Há 1 ano comprei 192GB DDR3 por literalmente 60 dólares, 5 dólares por módulo
      Agora está cerca de 22 dólares por módulo, então algo como 350 dólares no total. Não faço ideia de quem está fazendo o quê com DDR3
    • A suposição antiga de que era possível conseguir dezenas de GB de RAM por pouco dinheiro foi completamente destruída
      O valor de SSDs ultrarrápidos como Optane pode aumentar muito
    • Arrumando a garagem, encontrei dois drives Samsung EVO 4TB sem uso
  • Em tudo o que leio, a capacidade de RAM parece crescer algo como 20~25% ao ano, mas isso não parece suficiente
    Mesmo para uso de consumidor, celulares e notebooks melhorariam bastante com o dobro de RAM, e nem é preciso falar do tamanho da demanda de IA
    Não parece que essa tendência vai desaparecer. Talvez não cresça tão rápido quanto agora, mas também não deve sumir. Entendo por que as fabricantes de memória não querem quebrar a si mesmas, mas deveria haver alguma forma de transferir esse risco para provedores de modelos ou outros participantes do ecossistema e elevar a capacidade de RAM para algo mais próximo de 50% ao ano

    • Só o acordo da OpenAI já poderia absorver dois anos desse crescimento
      Num mercado competitivo, é ineficiente que fabricantes de RAM deixem de vender para quem quer comprar
      Não sei qual era a taxa real de crescimento antes de outubro, mas alguém aqui provavelmente sabe
    • O maior risco é o lado chinês de CXML sair ganhando, tomar o mercado abandonado por outras empresas e depois, quando os custos começarem a se normalizar, competir e expulsar os incumbentes
      Sobre 20~25% ser insuficiente, não me parece um número tão absurdo se assumirmos que os planos de expansão de datacenters batam num limite e desacelerem fortemente, e que a febre da IA esfrie
      No curto prazo, 20~25% pode não bastar, mas se a expansão de IA parar ainda este ano, em vez de escassez haverá um enorme excesso de oferta
    • Em teoria, um novo mercado futuro para componentes de chips poderia ajudar
      Porque permitiria que fornecedores de DRAM fizessem hedge desse risco
    • Segundo um artigo recente, HBM é 3 vezes menos eficiente que LPDDR em área de wafer, mas oferece mais de 3 vezes a largura de banda
      E se fosse vantajoso que todo mundo comprasse computadores, por exemplo, 1/3 mais lentamente e migrasse tudo para HBM?
      A distância entre capacidade de computação e memória vem aumentando há muito tempo, e talvez a migração para HBM, por dolorosa que seja, seja exatamente o que é necessário
      É melhor ter 3 computadores intermediários com baixa largura de banda de memória ou esperar um pouco mais, estatisticamente, para que todos comprem computadores novos a 1/3 da velocidade em termos de área, mas com largura de banda muito maior?
  • Vendo a direção atual, eu realmente me pergunto como vão sustentar o mercado consumidor de jogos e machine learning
    Cloud gaming certamente virá no futuro, e talvez só puristas como eu comprem uma RTX 5090 para pagar um prêmio por jogos offline

    • No longo prazo, cloud gaming é inevitável
      Porque é economicamente mais eficiente amortizar o custo do hardware necessário para renderização gráfica entre vários consumidores, não deixá-lo ocioso quando não está em uso e implantá-lo em POPs junto com os assets dos jogos
      Se computação suficiente para jogos rodar na borda, isso também viabiliza jogos tecnologicamente mais avançados que hoje ainda não fecham a conta economicamente. Acho que há poucos jogos assim hoje principalmente porque ainda falta mercado e adoção de cloud gaming, e por consequência também falta know-how técnico
      No momento em que o custo de renderizar os jogos que as pessoas querem em hardware de consumo ficar difícil de bancar, até quem resiste provavelmente acabará convencido, e esse modelo pode se firmar
  • Não vou sair de uma build DDR4 até que os preços voltem minimamente ao normal, pelo menos em parte
    Ainda tenho 32GB de memória DDR4 2133MHz de backup comprada antigamente, e agora uso 3200MHz. Isso significa que os fabricantes de CPU também não vão ver meu dinheiro. O 5800X é suficiente por um bom tempo, e não tenho motivo para comprar uma GPU nova. Claro, a B580 não é perfeita, mas

    • E se agora for o preço mais baixo de todos os tempos daqui para frente?
  • É muito irônico que o Irã tenha bloqueado o fornecimento de hélio
    Ao mesmo tempo, o Irã depende de propaganda de baixa qualidade gerada por IA para desestabilizar seus inimigos. Parece uma daquelas ironias históricas que só ficam claras depois

  • Para gamers e entusiastas de PC que não estão totalmente imersos em IA, este é realmente um período terrível

    • Isso vai matar 100% o mercado de PC montado em casa
      Quando comecei a montar PCs para jogos, a placa de vídeo topo de linha custava 750 dólares neozelandeses. Agora só a GPU custa 10.000 dólares, e a RAM adiciona mais 1.000~2.000 dólares
      Antes, PC gamer era um hobby acessível; agora, aviação geral parece uma alternativa razoável
    • Eu vejo justamente o contrário
      No curto prazo, é verdade que os hobbystas sofrem pressão, mas o capital necessário para empurrar a fronteira de ponta ainda é pequeno comparado ao de empresas da Fortune 500. Em breve os hobbystas também devem se beneficiar, especialmente se o mercado entrar em colapso
    • É um período terrível até para quem está totalmente mergulhado em IA
  • Fico me perguntando por que os hyperscalers não fazem mais integração vertical e constroem suas próprias fabs
    Mesmo que uma fab custe 1 bilhão de dólares, eles estão gastando centenas de bilhões para comprar chips da Nvidia e de outras empresas

    • Não sei se eles necessariamente precisam se verticalizar; talvez seja melhor financiar diretamente a expansão de capacidade de produção, como a Apple faz ao ampliar novas tecnologias para o iPhone
      Mas o fato de hyperscalers e empresas de IA não fazerem isso diz muito sobre o quanto realmente acreditam na demanda futura por IA
      Empresas de IA afirmam que precisam de uma expansão gigantesca, mas não querem assumir o risco de capital necessário para ela
      Ouvimos muita lamentação triste do lado da IA dizendo que fabricantes de chips os estão travando, mas quem realmente tem o dinheiro para financiar facilmente essa expansão? Os fabricantes de chips estão nesse jogo há muito mais tempo. Quando Sam Altman saiu falando que seriam necessárias fabs de 7 trilhões de dólares, as empresas de IA mostraram que estavam dispostas a fazer alegações absurdas e perderam credibilidade
      O que é necessário agora é direcionar diretamente para o financiamento de fabs uma parcela muito pequena do caixa gigantesco que elas acumularam
    • Fabs estão entre as tecnologias de ponta mais complexas que existem
      É um tipo de “ciência de foguetes” dos dias atuais, e não é algo que se resolva só com dinheiro. É perfeitamente possível queimar bilhões de dólares e não obter resultado nenhum
      Basta ver como a Intel tem sofrido para competir nos últimos anos. Eles estão nesse negócio há décadas
    • Mesmo tendo o know-how necessário, uma fab leva anos para ser construída
      Sem esse know-how, seriam necessários experimentos adicionais antes de competir com fabricantes já estabelecidos. Quando conseguirem produzir chips utilizáveis, a escassez talvez já tenha acabado
    • A margem média de uma fab é muito apertada em comparação com a das big techs, e o risco é proporcionalmente alto
      Provavelmente não é o tipo de negócio que elas queiram integrar
    • Uma fab custa 15~20 bilhões de dólares e leva pelo menos 5 anos para ser construída
      Além disso, exige uma especialização que nenhuma dessas empresas possui
  • Há uma semana comprei um servidor Dell usado
    O equipamento inteiro, com CPU de 12 núcleos e 32GB de RAM DDR4 ECC, custou quase o mesmo que comprar só 64GB de DDR RAM. Espero que essa situação absurda acabe logo. Caso contrário, a dor vai se espalhar para outros mercados também. Li recentemente que as vendas de gabinetes de PC caíram mais de 40%

    • Por causa do aumento do custo da RAM, pessoas pobres já estão sendo expulsas até do mercado de celulares baratos
      https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
    • Tenho a sensação de que, quando a bolha da IA estourar, o mercado de PCs já terá sido destruído de forma irreversível
      Os fabricantes que passaram a produzir peças “enterprise” não vão voltar ao mercado de componentes para consumidores. Porque até lá esse mercado já não existirá mais
      E, quando sobrar um monte de datacenters incapazes de ganhar dinheiro com conteúdo gerado de baixa qualidade, eles serão reaproveitados para SaaS. Algo como o OnShape se expandindo para todos os aplicativos
      A maioria dos usuários aparentemente não se importa muito em armazenar tudo o que cria em serviços de nuvem, e isso pode ser vendido com facilidade como alternativa a possuir hardware de desktop ou notebook “caro”
    • Também dá para ver por outro ângulo
      Se os hyperscalers usam mais RAM e essa RAM não vai para o consumidor, isso significa que todo o trabalho pesado acontece na nuvem
      Por que hyperscalers e consumidores precisariam ter RAM ao mesmo tempo? O consumidor vai querer mais RAM para rodar modelos localmente, mas aí a capacidade dos hyperscalers ficaria ociosa
  • Fabricantes de memória acumulam uma montanha de propriedade intelectual
    Então, mesmo que alguém tenha capacidade fabril sobrando e queira entrar na fabricação de memória, terá de enfrentar uma barreira enorme de patentes
    A maioria das empresas de memória faz acordos de bastidores para compensar mutuamente violações das patentes umas das outras
    Não consigo ver bem como um novo fabricante de memória conseguiria surgir sem afundar em custos de licenciamento