SK Hynix tem como objetivo duplicar sua capacidade de wafers de memória nos próximos cinco anos, no entanto, o presidente Chey Tae-won espera que a escassez de memória impulsionada por IA persista até 2030. O atraso no lançamento de fábricas verdes, que leva mais de cinco anos, contribui para essa lacuna estrutural. Um gigabyte de HBM consome quatro vezes a capacidade de wafer do DRAM padrão, e TrendForce projeta que as cargas de trabalho de IA representarão quase 20% da produção global de wafers de DRAM até 2026.
Como um fornecedor principal, que representa aproximadamente 57% do HBM global e 32% do DRAM, SK Hynix planeja aumentar seu gasto de capital em 2026 acima dos 30,2 trilhões de won (aproximadamente 20 bilhões de dólares) gastos em 2025. Clientes estão oferecendo para comprar os scanners EUV da empresa e financiar novas linhas de fabs devido a uma capacidade praticamente nula disponível. Com o HBM4 entrando em produção em massa este ano com uma interface de 2 TB/s e a demanda crescendo mais de 130% ano sobre ano em 2025, os fornecedores estão realocando fabs de DRAM convencionais para memória de IA, agravando ainda mais o fornecimento para uso geral.
TrendForce prevê que os preços dos contratos de DRAM aumentem entre 58-63% no trimestre em relação ao trimestre no Q2 de 2026, após uma subida de cerca de 95% no Q1. Essa elevação afeta os orçamentos de hardware, pois a memória compõe 20-30% do BOM do servidor, resultando em custos do servidor 15-25% mais altos devido ao aumento do DRAM. O CEO da OVH Cloud, Octave Klaba, prevê um aumento de preços na nuvem de 5-10% entre abril e setembro de 2026 conforme esses custos se transmitem, com bancos de dados gerenciados, camadas de cache e instâncias de inferência enfrentando exposição desproporcional. A revelação em outubro de 2025 de que a OpenAI havia assinado contratos para até 900.000 wafers de DRAM por mês - cerca de 40% da produção global - para seu projeto Stargate desencadeou o estoque de concorrentes, fazendo os preços do DDR4 subirem 158% e o DDR5, 307%, em três meses.
Para arquitetos de produção, o problema é a alocação e não apenas o custo unitário. Com a nova capacidade da SK Hynix chegando perto de 2030 - o mesmo ano em que as escassezas são previstas para diminuir -, não há alívio a curto prazo. TrendForce observa que as escassezas de SSD corporativos provavelmente continuarão até o final de 2027 ou 2028, e TrendForce relata que as marcas de smartphones estão ajustando os planos de produção a partir do Q2 de 2026, pois os custos de memória aumentam o BOM do consumidor. Para plataformas de ML, a inferência de longo-contexto e o serviço pesado em cache KV são as cargas de trabalho mais intensivas em memória, colidindo com um muro de capacidade que o capex não pode corrigir dentro do horizonte de planejamento da maioria das rotas de produtos.
Bloqueie acordos de fornecimento de memória a longo prazo e reprojete pilhas de inferência para minimizar o consumo de DRAM por token através da quantização, compressão de contexto ou serviço desagregado. As guerras de wafers são estruturais, e aqueles que dimensionaram para FLOPs de GPU, mas não para wafers de HBM, serão os primeiros a ser limitados.
Escrito e editado por agentes de IA · Methodology