- HBM subiu de 52% no 1º trimestre de 2024 para 63% no 4º trimestre de 2025 com base na média ponderada por volume de produção dos chips de IA da Nvidia, AMD, Google e Amazon
- No mesmo período, a participação dos dies lógicos ficou quase estável em cerca de 13%, enquanto o empacotamento avançado caiu de 19% para 15% e os componentes auxiliares de 15% para 9%
- O gasto com HBM das quatro empresas de design aumentou de cerca de US$ 12 bilhões em 2024 para US$ 32 bilhões em 2025, crescendo ano a ano mais rápido do que os demais componentes
- O gasto total com componentes de chips de IA subiu de cerca de US$ 22 bilhões para US$ 52 bilhões, e só a HBM respondeu por cerca de US$ 20 bilhões do aumento
- Em 2026, a pressão de custos pode aumentar ainda mais com a escassez de memória e a alta de preços, e Microsoft e Meta também apontaram o aumento no preço de componentes como fator para a alta dos investimentos em capital
Mudança principal
- A participação da memória de alta largura de banda (HBM) nos gastos com componentes de chips de IA subiu de 52% no 1º trimestre de 2024 para 63% no 4º trimestre de 2025
- Essa estimativa é uma média ponderada por volume de produção de todos os chips de IA projetados por Nvidia, AMD, Google e Amazon
- No mesmo período, os dies lógicos ficaram praticamente inalterados em cerca de 13%, o empacotamento avançado caiu de 19% para 15% e os componentes auxiliares recuaram de 15% para 9%
- O gasto com HBM das quatro empresas de design aumentou de cerca de US$ 12 bilhões em 2024 para US$ 32 bilhões em 2025, com crescimento ano a ano mais rápido do que o dos outros componentes
- O gasto total com componentes de chips de IA cresceu de cerca de US$ 22 bilhões em 2024 para cerca de US$ 52 bilhões em 2025, e só o gasto com HBM respondeu por cerca de US$ 20 bilhões do aumento
Pressão de custos em 2026
- A HBM pode passar a representar uma fatia ainda maior dos custos em 2026, com a continuidade da escassez de oferta e da alta de preços
- A previsão de US$ 190 bilhões em investimentos de capital no ano fiscal de 2026 da Microsoft inclui cerca de US$ 25 bilhões em aumentos de preços de componentes
- A Meta elevou em US$ 10 bilhões sua faixa de investimentos de capital para 2026 e citou os preços mais altos dos componentes como motivo
Método de cálculo e escopo dos dados
- Para cada chip de IA projetado por Nvidia, AMD, Google e Amazon, foi estimado o custo por chip de memória, die lógico, empacotamento avançado e componentes auxiliares
- Multiplicando o custo dos componentes de cada chip pelo volume de produção trimestral estimado, foi calculado o gasto total com componentes por categoria, e então a participação sobre o gasto total entre o 1º trimestre de 2024 e o 4º trimestre de 2025
- As estimativas de custo dos componentes foram obtidas no AI Chip Components explorer, que monta especificações de componentes por chip com base em divulgações financeiras, materiais de fornecedores e relatórios de analistas
- A metodologia detalhada pode ser consultada na documentação metodológica do explorer
Categorias de componentes
-
Memória
- Inclui pilhas de HBM, abrangendo HBM3 e HBM3e
-
Lógica
- Inclui dies lógicos de processos avançados de 3~5nm
-
Empacotamento
- Inclui o empacotamento avançado CoWoS da TSMC
-
Componentes auxiliares
- Inclui substratos, fornecimento de energia e outros elementos de entrada que não são lógica nem memória
Tratamento da incerteza
- Há incerteza de custo no custo unitário de cada componente, como preço de pilhas de HBM, preço de dies lógicos e preço de pacotes CoWoS
- Os custos por componente de cada chip foram modelados com intervalo de confiança de 90%
- Como a participação de um componente é o custo desse componente dividido pelo custo total, tanto o numerador quanto o denominador são incertos
- Dois tipos de faixa são apresentados em conjunto
- Faixa em que varia apenas o custo desse componente: a participação quando o custo desse componente está no 5º ou no 95º percentil, enquanto os outros três componentes permanecem na mediana
- Faixa em que todos os componentes variam para valores extremos: a participação quando esse componente está em um extremo do intervalo de confiança e todos os demais componentes estão simultaneamente no extremo oposto
Participação trimestral dos componentes
-
1º trimestre de 2024
- A participação da memória foi de 52%, com faixa de 48~56% quando só o custo desse componente varia e de 42~62% quando todos os componentes variam para valores extremos
- A participação da lógica foi de 14%, com faixa de 12~17% quando só o custo desse componente varia e de 10~20% quando todos os componentes variam para valores extremos
- A participação do empacotamento foi de 19%, com faixa de 14~24% quando só o custo desse componente varia e de 12~27% quando todos os componentes variam para valores extremos
- A participação dos componentes auxiliares foi de 15%, com faixa de 13~18% quando só o custo desse componente varia e de 11~21% quando todos os componentes variam para valores extremos
-
4º trimestre de 2025
- A participação da memória foi de 63%, com faixa de 60~67% quando só o custo desse componente varia e de 54~73% quando todos os componentes variam para valores extremos
- A participação da lógica foi de 13%, com faixa de 10~16% quando só o custo desse componente varia e de 9~19% quando todos os componentes variam para valores extremos
- A participação do empacotamento foi de 15%, com faixa de 11~19% quando só o custo desse componente varia e de 9~22% quando todos os componentes variam para valores extremos
- A participação dos componentes auxiliares foi de 10%, com faixa de 8~10% quando só o custo desse componente varia e de 7~12% quando todos os componentes variam para valores extremos
Premissas e limitações
- Os custos dos componentes podem variar conforme contrato, fornecedor e momento, então há incerteza nas estimativas de custo por chip
- Também há incerteza nas estimativas de volume de produção trimestral e na composição por tipo de chip, e essa incerteza está refletida nas participações reportadas
Dados e ferramenta de exploração
- AI chip component cost shares by quarter: CSV, atualizado em 21 de maio de 2026
- AI Chip Components: ferramenta de exploração de dados sobre consumo na cadeia de suprimentos de chips de IA
1 comentários
Comentários do Hacker News
Inferência e treinamento de IA parecem ter um caminho para reduzir os custos de hardware em cerca de 3x e os custos totais em cerca de 2x, mesmo sem nenhuma inovação tecnológica
Basta que a oferta de DRAM alcance a demanda; seja via expansão da fabricação ou atendendo o pico de demanda no ritmo atual de produção, é apenas uma questão de tempo
Há muita coisa a criticar nas frases que Sam Altman espalhou culturalmente, mas no longo prazo a ideia de que “agora é o pior momento de todos os que virão” me parece um ponto bem interessante e subestimado
Daqui a 10 anos, treinar LLMs no nível atual provavelmente será algo tão básico quanto operar bancos de dados hoje. O nível atual já é bastante sofisticado, e independentemente dos avanços de hardware, só de criar sistemas de treinamento por aprendizado por reforço melhores já parece haver muito espaço para subir mais
Recomendo muito olhar os projetos do Allen Institute no GitHub e no HF. Há materiais open source para treinamento, incluindo recursos para treinar LLMs do zero com Common Crawl e ajustes interessantes do qwen, então dá para ter um gostinho de como serão projetos de tarde ou materiais educacionais em breve
Esse setor tende a manter o mercado em estado de escassez de oferta, porque caso contrário o excesso de oferta posterior destrói as empresas. Em vez disso, a oferta só será realocada de áreas menos lucrativas, como mobile e computação pessoal, para áreas mais rentáveis
Ponto flutuante IEEE é notoriamente ruim em larguras de bits baixas, especialmente 16 bits ou menos. Formatos como posit são muito melhores em 16 bits ou 8 bits. Se for possível treinar com 16 bits em vez de 32 por valor e com perda de precisão muito menor do que na transição de IEEE32 para IEEE16, isso seria bastante relevante
Alguns anos atrás comprei 96GB de RAM por cerca de 250 dólares, e hoje a mesma RAM custa 1.200 dólares
Na Amazon, o mesmo kit está agora por 1.048,90 dólares
Módulos de memória enterprise usados estavam realmente a preço de banana no eBay
Agora está cerca de 22 dólares por módulo, então algo como 350 dólares no total. Não faço ideia de quem está fazendo o quê com DDR3
O valor de SSDs ultrarrápidos como Optane pode aumentar muito
Em tudo o que leio, a capacidade de RAM parece crescer algo como 20~25% ao ano, mas isso não parece suficiente
Mesmo para uso de consumidor, celulares e notebooks melhorariam bastante com o dobro de RAM, e nem é preciso falar do tamanho da demanda de IA
Não parece que essa tendência vai desaparecer. Talvez não cresça tão rápido quanto agora, mas também não deve sumir. Entendo por que as fabricantes de memória não querem quebrar a si mesmas, mas deveria haver alguma forma de transferir esse risco para provedores de modelos ou outros participantes do ecossistema e elevar a capacidade de RAM para algo mais próximo de 50% ao ano
Num mercado competitivo, é ineficiente que fabricantes de RAM deixem de vender para quem quer comprar
Não sei qual era a taxa real de crescimento antes de outubro, mas alguém aqui provavelmente sabe
Sobre 20~25% ser insuficiente, não me parece um número tão absurdo se assumirmos que os planos de expansão de datacenters batam num limite e desacelerem fortemente, e que a febre da IA esfrie
No curto prazo, 20~25% pode não bastar, mas se a expansão de IA parar ainda este ano, em vez de escassez haverá um enorme excesso de oferta
Porque permitiria que fornecedores de DRAM fizessem hedge desse risco
E se fosse vantajoso que todo mundo comprasse computadores, por exemplo, 1/3 mais lentamente e migrasse tudo para HBM?
A distância entre capacidade de computação e memória vem aumentando há muito tempo, e talvez a migração para HBM, por dolorosa que seja, seja exatamente o que é necessário
É melhor ter 3 computadores intermediários com baixa largura de banda de memória ou esperar um pouco mais, estatisticamente, para que todos comprem computadores novos a 1/3 da velocidade em termos de área, mas com largura de banda muito maior?
Vendo a direção atual, eu realmente me pergunto como vão sustentar o mercado consumidor de jogos e machine learning
Cloud gaming certamente virá no futuro, e talvez só puristas como eu comprem uma RTX 5090 para pagar um prêmio por jogos offline
Porque é economicamente mais eficiente amortizar o custo do hardware necessário para renderização gráfica entre vários consumidores, não deixá-lo ocioso quando não está em uso e implantá-lo em POPs junto com os assets dos jogos
Se computação suficiente para jogos rodar na borda, isso também viabiliza jogos tecnologicamente mais avançados que hoje ainda não fecham a conta economicamente. Acho que há poucos jogos assim hoje principalmente porque ainda falta mercado e adoção de cloud gaming, e por consequência também falta know-how técnico
No momento em que o custo de renderizar os jogos que as pessoas querem em hardware de consumo ficar difícil de bancar, até quem resiste provavelmente acabará convencido, e esse modelo pode se firmar
Não vou sair de uma build DDR4 até que os preços voltem minimamente ao normal, pelo menos em parte
Ainda tenho 32GB de memória DDR4 2133MHz de backup comprada antigamente, e agora uso 3200MHz. Isso significa que os fabricantes de CPU também não vão ver meu dinheiro. O 5800X é suficiente por um bom tempo, e não tenho motivo para comprar uma GPU nova. Claro, a B580 não é perfeita, mas
É muito irônico que o Irã tenha bloqueado o fornecimento de hélio
Ao mesmo tempo, o Irã depende de propaganda de baixa qualidade gerada por IA para desestabilizar seus inimigos. Parece uma daquelas ironias históricas que só ficam claras depois
Para gamers e entusiastas de PC que não estão totalmente imersos em IA, este é realmente um período terrível
Quando comecei a montar PCs para jogos, a placa de vídeo topo de linha custava 750 dólares neozelandeses. Agora só a GPU custa 10.000 dólares, e a RAM adiciona mais 1.000~2.000 dólares
Antes, PC gamer era um hobby acessível; agora, aviação geral parece uma alternativa razoável
No curto prazo, é verdade que os hobbystas sofrem pressão, mas o capital necessário para empurrar a fronteira de ponta ainda é pequeno comparado ao de empresas da Fortune 500. Em breve os hobbystas também devem se beneficiar, especialmente se o mercado entrar em colapso
Fico me perguntando por que os hyperscalers não fazem mais integração vertical e constroem suas próprias fabs
Mesmo que uma fab custe 1 bilhão de dólares, eles estão gastando centenas de bilhões para comprar chips da Nvidia e de outras empresas
Mas o fato de hyperscalers e empresas de IA não fazerem isso diz muito sobre o quanto realmente acreditam na demanda futura por IA
Empresas de IA afirmam que precisam de uma expansão gigantesca, mas não querem assumir o risco de capital necessário para ela
Ouvimos muita lamentação triste do lado da IA dizendo que fabricantes de chips os estão travando, mas quem realmente tem o dinheiro para financiar facilmente essa expansão? Os fabricantes de chips estão nesse jogo há muito mais tempo. Quando Sam Altman saiu falando que seriam necessárias fabs de 7 trilhões de dólares, as empresas de IA mostraram que estavam dispostas a fazer alegações absurdas e perderam credibilidade
O que é necessário agora é direcionar diretamente para o financiamento de fabs uma parcela muito pequena do caixa gigantesco que elas acumularam
É um tipo de “ciência de foguetes” dos dias atuais, e não é algo que se resolva só com dinheiro. É perfeitamente possível queimar bilhões de dólares e não obter resultado nenhum
Basta ver como a Intel tem sofrido para competir nos últimos anos. Eles estão nesse negócio há décadas
Sem esse know-how, seriam necessários experimentos adicionais antes de competir com fabricantes já estabelecidos. Quando conseguirem produzir chips utilizáveis, a escassez talvez já tenha acabado
Provavelmente não é o tipo de negócio que elas queiram integrar
Além disso, exige uma especialização que nenhuma dessas empresas possui
Há uma semana comprei um servidor Dell usado
O equipamento inteiro, com CPU de 12 núcleos e 32GB de RAM DDR4 ECC, custou quase o mesmo que comprar só 64GB de DDR RAM. Espero que essa situação absurda acabe logo. Caso contrário, a dor vai se espalhar para outros mercados também. Li recentemente que as vendas de gabinetes de PC caíram mais de 40%
https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
Os fabricantes que passaram a produzir peças “enterprise” não vão voltar ao mercado de componentes para consumidores. Porque até lá esse mercado já não existirá mais
E, quando sobrar um monte de datacenters incapazes de ganhar dinheiro com conteúdo gerado de baixa qualidade, eles serão reaproveitados para SaaS. Algo como o OnShape se expandindo para todos os aplicativos
A maioria dos usuários aparentemente não se importa muito em armazenar tudo o que cria em serviços de nuvem, e isso pode ser vendido com facilidade como alternativa a possuir hardware de desktop ou notebook “caro”
Se os hyperscalers usam mais RAM e essa RAM não vai para o consumidor, isso significa que todo o trabalho pesado acontece na nuvem
Por que hyperscalers e consumidores precisariam ter RAM ao mesmo tempo? O consumidor vai querer mais RAM para rodar modelos localmente, mas aí a capacidade dos hyperscalers ficaria ociosa
Fabricantes de memória acumulam uma montanha de propriedade intelectual
Então, mesmo que alguém tenha capacidade fabril sobrando e queira entrar na fabricação de memória, terá de enfrentar uma barreira enorme de patentes
A maioria das empresas de memória faz acordos de bastidores para compensar mutuamente violações das patentes umas das outras
Não consigo ver bem como um novo fabricante de memória conseguiria surgir sem afundar em custos de licenciamento