1 pontos por GN⁺ 4 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • À medida que os data centers de IA absorvem a oferta de DRAM, a tendência de longo prazo de eletrônicos de consumo ficarem mais baratos e mais poderosos está sendo abalada
  • A DRAM é um gargalo de memory wall que evolui mais lentamente que os processadores, e expandir fábricas de ponta exige US$ 15 bilhões a US$ 20 bilhões e vários anos
  • Samsung, SK Hynix e Micron respondem por mais de 90% da produção e estão reduzindo wafers de DDR e LPDDR para atender à demanda por HBM, de margem mais alta
  • Do 1º trimestre de 2025 ao 1º trimestre de 2026, a LPDDR4 subiu 250% e a LPDDR5, 220%, destruindo a viabilidade econômica de smartphones abaixo de US$ 100
  • O impacto nos smartphones baratos apareceu primeiro na Africa e na India, e até Apple, Samsung e Dell começaram a sofrer a pressão da alta dos custos de memória

A reviravolta na era da queda de preços dos eletrônicos de consumo

  • Em 1985, o IBM PC AT custava cerca de US$ 6.000, o equivalente a US$ 19.400 em valores de 2026, algo em torno de um quarto da renda mediana dos EUA na época
  • Hoje, em mercados de Nairobi ou Lagos, é possível comprar um smartphone barato como o Tecno Spark Go, da chinesa Transsion, por US$ 30 a US$ 120, e esse aparelho traz um processador capaz de fazer bilhões de cálculos por segundo
  • Durante décadas, os eletrônicos de consumo ficaram mais poderosos e mais baratos, e os smartphones de baixo custo abriram o acesso à internet para centenas de milhões das pessoas mais pobres do mundo
  • Em 2026, a IDC prevê que os embarques globais de smartphones cairão 13%, marcando a maior queda anual da história, e que a retração passará de 20% na Africa e no Middle East
  • A Reuters descreveu isso como um “reset estrutural de todo o mercado”, e o choque está concentrado no segmento dos smartphones mais baratos
  • A causa central é a inelasticidade da oferta de memória e o salto da demanda de data centers de IA; à medida que a memória é realocada dos eletrônicos de consumo para a IA, o custo de fabricação de smartphones sobe rapidamente

Por que a DRAM virou o gargalo

  • Um smartphone é um pequeno computador com processador, memória, armazenamento e placa de circuito, e sua estrutura interna é essencialmente semelhante à de um notebook ou servidor
  • Os processadores melhoraram exponencialmente por décadas ao tornar os transistores menores e mais eficientes, fluxo conhecido como Moore’s Law
  • Processadores só conseguem tratar dados aos quais têm acesso, e nos computadores modernos esses dados vêm principalmente da DRAM
  • Nas décadas de 1980 e 1990, a velocidade dos processadores melhorou 60% ao ano, enquanto a velocidade da DRAM melhorou 7% ao ano.pdf)
  • Essa diferença criou a memory wall, um dos principais gargalos do desempenho computacional, e grande parte do trabalho em arquitetura de computadores se concentrou em contornar o descompasso entre processadores e DRAM
  • As células de DRAM são compostas por um transistor e um capacitor que armazena carga, e reduzir capacitores é muito mais difícil do que reduzir transistores
  • À medida que os capacitores ficam menores, aumentam os riscos de vazamento de carga, perda de carga e interferência entre células vizinhas, exigindo estruturas cada vez mais complexas para melhorar a eficiência da DRAM
  • Construir uma única instalação de fabricação de DRAM de última geração custa cerca de US$ 15 bilhões a US$ 20 bilhões, com mais bilhões necessários para equipamentos de litografia e gravação, e são necessários anos até atingir rendimentos competitivos

A estrutura da indústria de DRAM e a disciplina de oferta

  • A DRAM é próxima de uma commodity substituível entre fabricantes, de modo que chips da Samsung e da SK Hynix podem entrar no mesmo dispositivo
  • Processadores têm um caráter muito mais personalizado, em que não se troca facilmente um chip da Intel por um da Apple, mas a DRAM segue padrões da indústria e por isso é mais genérica
  • Por causa da manufatura intensiva em capital e da natureza comoditizada do produto, a indústria de DRAM está exposta a fortes ciclos de boom e bust
  • Demandas específicas, como a adoção do Windows PC nos anos 1990, elevam preços e investimentos, e o padrão recorrente é que o excesso acumulado de investimento leva a sobreoferta e colapso de preços
  • A Intel dominou o mercado de memória no começo dos anos 1970, mas saiu nos anos 1980 para se concentrar em processadores; Texas Instruments e IBM também abandonaram o setor nos anos 1990
  • A Qimonda, da Germany, colapsou em 2009, e a Elpida, do Japan, faliu em 2012
  • Nos anos 1990, havia cerca de 20 produtores relevantes de DRAM no mundo, mas hoje Samsung, SK Hynix e Micron respondem por mais de 90% da produção global
  • Depois de atravessar ciclos passados, os fabricantes de memória que sobreviveram aprenderam uma disciplina de capital de não atender totalmente a demanda; mesmo quando a demanda sobe, preferem suportar preços mais altos e a saída dos consumidores marginais a expandir produção às pressas

Explosão da demanda por HBM e realocação de wafers

  • DDR, LPDDR e HBM são produzidas a partir do mesmo material de origem, o wafer de silício, mas são projetadas para usos diferentes
  • DDR é usada em dispositivos como o MacBook Pro e oferece tensão relativamente mais alta e maior largura de banda, enquanto LPDDR é usada em smartphones como o iPhone, priorizando baixa tensão e eficiência de bateria
  • HBM é usada em data centers onde rodam IAs como Claude e ChatGPT, sendo projetada para fornecer grandes volumes de dados muito rapidamente a vários processadores
  • A decisão central dos fabricantes de memória é como alocar wafers entre DDR, LPDDR e HBM; uma parte fica presa a contratos de longo prazo com grandes compradores como Apple e Dell, e outra parte é vendida no mercado spot
  • No fim dos anos 2010, as margens de DDR, LPDDR e HBM eram em geral parecidas, então a alocação de wafers seguia a demanda final, e como smartphones eram o maior mercado de memória, a LPDDR ficava com a maior parte dos wafers
  • O treinamento e a execução de modelos de IA exigem repetir bilhões de multiplicações de matrizes em sequência e em paralelo, e hardwares especializados como GPUs da Nvidia e TPUs do Google precisam receber continuamente grandes quantidades de dados
  • A HBM empilha vários dies de DRAM em camadas, conecta-os por milhares de canais verticais e os posiciona ao lado da GPU ou TPU, permitindo transferir um volume de dados uma ordem de grandeza maior que a DDR
  • A desvantagem da HBM é sua intensidade de wafer muito alta; 1 GB de HBM consome mais de 3 vezes a capacidade de wafer de 1 GB de DDR ou LPDDR
  • Quando o ChatGPT foi lançado em novembro de 2022, os fabricantes de memória estavam em um período de queda de demanda, e no início de 2023 a atenção do setor ainda se limitava ao nível de “chatbots de IA podem reduzir a desaceleração do mercado de DRAM”
  • À medida que o uso de IA continuou explodindo e o padrão de uso migrou de chatbots para agentes executados por longos períodos, a demanda por HBM ficou muito maior do que o esperado
  • No fim de 2024, a escassez de HBM se intensificou de fato e, em 2025, as margens de HBM ficaram acima de 70%, enquanto as margens de DDR e LPDDR permaneceram na faixa de 20% a 30%

HBM se torna o centro da indústria de memória

  • Os fabricantes de memória estão realocando wafers em grande escala para aumentar a produção de HBM
  • A HBM respondeu por 2% dos wafers dos fabricantes de memória em 2023, subiu para 5% em 2024 e 10% em 2025, e deve chegar a 20% até o fim de 2026
  • Outros 3% devem ser destinados a DDR de alta densidade para servidores de IA, de modo que, em apenas três anos, a HBM passou de uma linha periférica para o núcleo da indústria de memória
  • A SK Hynix, que foi a primeira a atingir a produção em massa de nós avançados de HBM, viu a receita com HBM quadruplicar só em 2024, e no fim do mesmo ano a HBM já representava mais de 40% da receita de DRAM da empresa
  • A demanda por HBM continua superando a oferta, e a escassez de memória se tornou uma das principais restrições à expansão da infraestrutura de IA
  • A escassez de memória deu origem a soluções de contorno como quantização e a multi-head latent attention da DeepSeek
  • No fim de 2025, executivos de hyperscalers como Microsoft e Google estariam “quase morando na Coreia” para garantir alocação de volume da Samsung e da SK Hynix
  • Atualmente, mais de 30% do capex dos hyperscalers é gasto em DRAM
  • Samsung, SK Hynix e Micron somaram US$ 70 bilhões em lucro em 2025 e devem ganhar mais do que o dobro disso em 2026, tornando-se algumas das empresas mais lucrativas do mundo

Colapso dos modelos de smartphones de baixo custo

O impacto nos mercados emergentes e nas fabricantes de smartphones de baixo custo

A pressão se espalha para smartphones premium e para o mercado de PCs

Possibilidade de alívio no curto prazo e restrições persistentes

  • A Nvidia pretende lançar no quarto trimestre de 2026 a Vera Rubin, uma plataforma de supercomputador de IA em escala de rack que combina a GPU Rubin com a CPU Vera
  • A CPU Vera exigirá grandes volumes de LPDDR, e a expectativa é que, em 2027, a Vera Rubin consuma mais LPDDR do que Apple e Samsung juntas
  • Um relatório do JPMorgan projetou que, até 2027, a memória poderá representar 45% do custo dos componentes do iPhone; atualmente, esse patamar é de cerca de 10%
  • A Apple pode ter de escolher entre reduzir suas margens para defender participação de mercado ou elevar fortemente os preços dos produtos
  • No curto prazo, fabricantes de smartphones podem reagir reduzindo drasticamente a capacidade de memória por aparelho e diminuindo o desempenho, ou então conter a demanda com grandes aumentos de preço
  • As margens de LPDDR e DDR dispararam e podem até superar as de HBM, mas como uma parte significativa da capacidade de HBM já está comprometida em contratos de longo prazo, é difícil esperar uma migração rápida para DRAM de uso geral
  • Startups chinesas de memória são apontadas como um possível fator de alívio, capazes de preencher a lacuna de oferta de DDR e LPDDR
  • A ChangXin Memory Technologies já responde por mais de 30% do mercado de LPDDR na China e está expandindo capacidade rapidamente
  • No entanto, hyperscalers estão mais dispostos do que fabricantes de smartphones de entrada a pagar preços mais altos por acesso a DRAM, e a ChangXin também planeja destinar em 2026 cerca de 20% de sua capacidade de produção à linha HBM3

O que significa a reprecificação dos eletrônicos de consumo

  • Enquanto a escassez de memória para data centers de IA persistir, será difícil escapar da lógica econômica da falta de DRAM
  • Os eletrônicos de consumo parecem ter dificuldade para evitar uma reprecificação em larga escala nos próximos anos
  • Consumidores de países de baixa renda já estão sendo excluídos do mercado de smartphones, e os consumidores de países de alta renda estão se aproximando rapidamente de sentir a mesma pressão
  • Nas últimas décadas, o avanço tecnológico democratizou a computação, mas a tendência de longo prazo de os eletrônicos de consumo ficarem mais rápidos, baratos e poderosos a cada ano está se invertendo
  • O grupo que sente esse choque primeiro e com mais intensidade é a população mais pobre do mundo, e depois ele provavelmente se espalhará para uma base de consumidores mais ampla

1 comentários

 
GN⁺ 4 시간 전
Comentários do Hacker News
  • O título aqui não transmite bem o valor do texto. É um artigo profundo e interessante sobre como o mercado de memória funciona e por que o aumento da demanda por HBM usada em grandes racks de GPU pressiona a oferta de wafers DDR/LPDDR para notebooks e celulares

    • Esta frase também ajuda a entender muita coisa: “Os fabricantes de memória aprenderam uma lição muito específica com a história brutal do setor, em que a demanda despenca profundamente: nunca atendam toda a demanda”
      É difícil culpar a decisão de deixar parte da demanda reprimida para manter clientes por anos
    • Também existem fluxos de trabalho agentivos e uso de computador. Ainda há necessidade de servidores gerais para os agentes usarem
  • A explicação de que “este MacBook Pro em que estou escrevendo usa DDR porque um processador poderoso precisa de memória que acompanhe a velocidade de vários programas rodando ao mesmo tempo” está errada. O último MacBook Pro a usar DDR foi o de 2019, e todos os Macs com Apple Silicon usam LPDDR

    • A Apple usa LPDDR em MacBooks pelo menos desde 2015. Uma das reclamações sobre os MacBook Pro de 2016–2017 era que o LPDDR4 ainda não estava pronto para produção em massa, então eles continuaram com LPDDR3, enquanto o DDR4 comum já existia. O MacBook Pro de 2018 finalmente migrou para LPDDR4
    • Talvez o autor esteja escrevendo isso em um Intel Mac
    • No começo de 2005, o PowerBook G4 provavelmente foi o último notebook profissional a usar DDR. O MacBook Pro mencionado parece usar DDR4
  • Então é muito importante para o bem público que essas empresas de IA quebrem

    • Claro que vai acontecer. Assim como o ódio coletivo aos magnatas do petróleo, 100 anos atrás, os derrubou instantaneamente. /s
  • A parte mais surpreendente foi esta: construir uma fábrica de DRAM de ponta custa entre 15 e 20 bilhões de dólares, mais vários bilhões em equipamentos essenciais como máquinas de litografia e gravação, e ainda é preciso passar anos produzindo chips de memória defeituosos ou de baixa qualidade até que o rendimento se torne competitivo
    É realmente complexo e caro, mas quando se olha o dinheiro circulando entre Nvidia, Google, Microsoft, Amazon e Apple, isso até parece pequeno comparado ao volume com que compram e vendem participação umas nas outras no mercado de ações. A Apple, em especial, parece o tipo de empresa para a qual 20 bilhões de dólares estariam perdidos nas almofadas do sofá e, por ser forte em integração vertical e hardware, parece uma candidata plausível a construir sua própria fábrica de memória. Ainda assim, do ponto de vista dos executivos, o maior problema provavelmente são os “anos” necessários até o investimento dar resultado, e no curto prazo pode parecer melhor simplesmente comprar GPUs com HBM pelo preço absurdo que for

    • Empresas como a Apple certamente têm dinheiro para montar sua própria fábrica, mas conhecem muito bem os ciclos de alta e baixa de longo prazo do mercado de memória. Ainda lembro da escassez de DRAM no fim dos anos 80, que atrasou em um ano o lançamento do produto de uma startup da época
      É fácil pensar que a Apple se interessa por integração vertical de custos, mas na prática ela se concentra em integração vertical de margens. Quando avalia onde usar caixa, a métrica central é o retorno sobre o capital, especialmente a margem que esse capital pode gerar. Empresas abertas são avaliadas pela margem combinada, então procuram fontes de receita em que o capital investido possa elevar a margem média atual. Na média de longo prazo, a memória convencional historicamente é uma das áreas de pior margem no mercado de semicondutores. Construir uma fábrica para um processo novo é absurdamente caro, mas uma vez pronta, o DRAM padrão é relativamente fácil de escalar porque é bastante uniforme. As margens são boas quando um novo processo ou uma nova geração de RAM acaba de surgir, mas conforme o processo amadurece e o produto vira commodity, todo mundo aprende a fabricar mais e mais rápido, e a concorrência se intensifica. Aí começam a baixar preços para operar uma fábrica madura a 101% da capacidade, até que alguém mantém volume barato vendendo perto do custo, e, se sobra estoque, o preço cai até abaixo do custo. Por isso, empresas com muito caixa e margens altas, como a Apple, preferem comprar DRAM construída com o dinheiro dos outros. Enquanto o mercado de DRAM estiver sob pressão competitiva, a Apple pode usar seu enorme volume de pedidos para alternar entre fornecedores e comprar a RAM mais barata possível, produzida com capital de baixa margem de outros investidores
    • E se o mercado se estabilizar de novo, ou se a tecnologia de memória na qual você apostou por achar que estava à frente acabar indo em outra direção? Para fazer uma aposta tão cara, é preciso ter uma visão muito forte e específica. Por outro lado, o fato de eles não fazerem essa aposta talvez também diga algo sobre a visão interna deles
    • A Apple já tem histórico de financiar linhas de produção dedicadas para parceiros de manufatura de componentes genéricos, em vez de construir a fábrica ela mesma, para garantir fornecimento com preço total mais baixo
      Foi uma das primeiras medidas depois que Tim Cook entrou na Apple, para assegurar oferta suficiente de memória flash e assim migrar o iPod de discos rígidos para flash
    • Parte do motivo para os preços elevados dos equipamentos tem a ver com monopólios ao longo de toda a cadeia de suprimentos. Um grande motivo para torcer que a China alcance paridade nos nós de processo é que isso poderia quebrar monopólios em equipamentos UV, wafers, equipamentos de armazenamento e outros pontos da produção, criando concorrência. As energias renováveis estão nos levando rapidamente a um mundo de energia muito barata ou quase gratuita, mas isso não ajuda se a melhor forma de usar essa energia na produção continuar controlada por algumas poucas empresas
    • Embora eu ache que a Apple seja, financeiramente, uma candidata plausível para fazer algo assim, nunca tive a impressão de que ela entraria nisso apenas por eficiência vertical. Sempre houve uma visão de longo prazo para criar vantagens que os concorrentes teriam dificuldade de copiar, e a compra da PA Semi é um bom exemplo
      RAM não parece uma área em que simplesmente possuir a manufatura crie uma vantagem competitiva assimétrica. Parece só uma aposta de eficiência vertical que pode ou não funcionar. Claro, também posso estar sem imaginação
  • Jatin Malek explicou melhor a pressão sobre DRAM no Twitter: “O motivo de a RAM ter quadruplicado de preço é que enormes quantidades de RAM ainda não produzidas estão sendo compradas com dinheiro que não existe, para ir em GPUs que também ainda não foram produzidas, que serão instaladas em datacenters que ainda nem foram construídos, alimentados por infraestrutura que talvez nunca exista, para atender uma demanda que não é real, em busca de lucros matematicamente impossíveis”

    • Isso é só uma forma sarcástica de descrever qualquer investimento empresarial que exige comprar coisas que só existirão no futuro, e isso é completamente normal
      Dá para reescrever a mesma frase trocando por ferro e construção de ferrovias, dizendo que se está construindo trilhos para trens e passageiros que ainda não existem. Aí fica claro o quanto isso soa ridículo. Só a parte dos “lucros matematicamente impossíveis” é inventada e errada. Talvez a demanda real esteja até sendo subestimada, e os lucros podem ser enormes. Ninguém sabe ao certo, mas os lucros são muito, muito, muito possíveis
  • É impressionante como os maiores fatores inflacionários em décadas, talvez séculos, parecem estar acontecendo ao mesmo tempo por acaso
    A guerra com o Irã está elevando fortemente o preço do petróleo e, se não terminar, provavelmente causará escassez de quase tudo. A guerra na Ucrânia está agravando isso ao destruir a capacidade de refino da Rússia. A escassez de memória parece pronta para causar o mesmo efeito em eletrônicos de consumo essenciais para a economia moderna. Ao mesmo tempo, a onda da IA está causando demissões em massa, e as grandes empresas de IA já começam a sinalizar o fim da fase de almoço grátis subsidiado e uma mudança para um modelo de utilidade pública, o que aumentará os preços de todas as empresas dependentes de IA. Também existem as tarifas. Ali, ninguém parece saber o que vai acontecer. As fazendas também estão colapsando, e as mudanças climáticas estão acelerando isso, de modo que a escassez de alimentos pode chegar em poucos anos. Se não for cinismo deliberado, trata-se literalmente de uma sobreposição espantosa de falhas catastróficas de gestão

    • Tenho dificuldade em concordar só com a parte de que “a onda da IA está causando demissões em massa”. As demissões estão sendo atribuídas à IA, mas na prática são consequência do boom de contratações na pandemia e do ajuste posterior
      O dinheiro do setor de tecnologia está indo para construir datacenters e as turbinas a gás que vão fornecer energia para esses datacenters, e só ficou evidente que programadores não sabem fabricar turbinas a gás
    • William Gibson chamou esse tipo de fim de civilização, em que várias catástrofes como pandemia, guerra, falha de gestão, corrupção, escassez de recursos e colapso climático se sobrepõem em período parecido, de The Jackpot
    • Isso pode virar um ótimo bode expiatório para uma inflação por expansão monetária adicional
      A etapa 1 é criar aumentos visíveis de preço por motivos temporários. A etapa 2 é ampliar a oferta monetária quando esses motivos temporários desaparecerem. Os preços permanecem onde estão, e então você pode culpar as causas da etapa 1, ou empresas gananciosas que não baixam preços, sem mencionar que os preços poderiam ter caído quando os problemas sumissem
    • A destruição de refinarias russas pode até aumentar a parcela da oferta de petróleo bruto que chega ao mercado e reduzir um pouco os preços
    • O colapso das fazendas e a escassez de alimentos são a parte que mais merece atenção. Conflitos motivados por comida no passado desencadearam revoluções e guerras civis
      As pessoas conseguem suportar a falta de eletricidade, a falta de internet e a falta de gasolina. Mas a escassez de alimentos é diferente. A escassez de trigo provocada quando incêndios florestais na Sibéria destruíram a colheita anual de trigo da Rússia acelerou a Primavera Árabe, as guerras civis posteriores e a ascensão do ISIS
  • A história é que a oferta de celulares baratos está caindo por causa do preço da RAM, mas como foi a tendência de uso de RAM nos últimos 10 anos? Parece perfeitamente possível fabricar celulares com a quantidade de RAM que era padrão 10 anos atrás
    O compromisso seria usar algoritmos e recursos mais antigos, que consomem menos RAM, e dar um pouco mais de atenção ao uso de memória durante o desenvolvimento. Há bastante oportunidade aí, e hoje até dá para usar IA para otimizar o uso de RAM em software existente

    • Não faz sentido fabricar celulares com especificações antigas se eles não puderem rodar os apps feitos nos últimos 10 anos
      Basta pensar em desktops, navegadores e apps Electron: não há como rodar software moderno confortavelmente em máquinas de 2015. Linux pode ajudar, mas ainda assim há limites
    • O uso de RAM não depende só do software que vem no celular, mas talvez ainda mais dos apps e conteúdos que o usuário instala. Então isso não é um problema de um único fornecedor, mas exige uma adaptação de todo o ecossistema
  • Ouvi dizer que quando uma empresa compra toda a produção, ou a maior parte dela, isso é comportamento monopolista. Se um comprador dominante amarra a maior parte da cadeia de suprimentos com contratos de exclusividade, os concorrentes podem ficar sem acesso aos insumos de que precisam para sobreviver, o que violaria leis como a seção 2 do Sherman Antitrust Act

  • É engraçado ver tanta conversa sobre otimização. Na verdade, a era do vibe coding provavelmente vai na direção oposta

    • É só colocar otimização no skills.md e acrescentar uma linha no prompt: “otimize muito bem o código também”. Problema resolvido, emoji de óculos escuros
    • LLMs são bem boas em otimização. O prompt simples é este: reescreva essa porcaria de Electron em Rust com um framework de UI comprovado. Aí o uso de RAM cai 80%
    • Tenho um amigo que é vice-presidente de uma grande operadora de telecomunicações e está criando um app de análise de dados com Claude, sem ter experiência técnica. Ele reclamou que processar um determinado conjunto de dados levava três horas, então fui olhar
      O Claude tinha basicamente feito ele gerar um arquivo JSON de 300 MB e fazer todo o processamento diretamente em cima desses dados. Nem ele nem o Claude pensaram que existiam outras formas de lidar com os dados. Levei menos de 10 minutos para reduzir o tempo de processamento para menos de 1 minuto. Esse é o tipo de problema com vibe coding que me preocupa
  • Ótima notícia. Talvez as pessoas passem a tratar eletrônicos menos como itens descartáveis e comecem a valorizá-los mais. Talvez durabilidade e vida útil longa voltem a ser o padrão

    • As pessoas de Agbogbloshie provavelmente esperam ganhar mais dinheiro reciclando lixo eletrônico
      Acho desconfortável ver no TikTok streamers americanos ao vivo mostrando como recuperar ouro e metais de lixo eletrônico. Antes, isso era um trabalho muito sujo e de margem muito baixa, feito apenas pelos mais pobres do mundo. Agora, isso passou a ter tanto valor e a situação econômica dos EUA piorou tanto que americanos estão fazendo isso em casa e nos próprios quintais