SK Hynix tiene como objetivo duplicar su capacidad de wafers de memoria en los próximos cinco años, sin embargo, el presidente Chey Tae-won espera que la escasez de memoria impulsada por la IA persista hasta 2030. La demora en poner en marcha las fábricas verdes, que toma más de cinco años, contribuye a esta brecha estructural. Un gigabyte de HBM consume el cuatro veces la capacidad de wafer de la DRAM estándar, y TrendForce proyecta que las cargas de trabajo de IA representarán casi el 20% de la producción global de wafers de DRAM para 2026.

Como un proveedor principal, SK Hynix, que representa aproximadamente el 57% de la HBM global y el 32% de la DRAM, planea incrementar su gasto de capital para 2026 por encima de los 30.2 billones de won (aproximadamente 20 mil millones de dólares) invertidos en 2025. Los clientes ofrecen comprar los escáneres EUV de la empresa y prefinan nuevas líneas de fábrica debido a que efectivamente no hay capacidad disponible. Con la HBM4 entrando en producción masiva este año en una interfaz de 2 TB/s y la demanda creciendo en más del 130% año sobre año en 2025, los proveedores están reasignando fábricas de DRAM convencionales hacia la memoria de IA, lo que apretona aún más el suministro de uso general.

TrendForce prevé que los precios de los contratos de DRAM aumenten entre el 58 y el 63% trimestralmente en el segundo trimestre de 2026, después de un aumento aproximado del 95% en el primer trimestre. Este aumento afecta los presupuestos de hardware, ya que la memoria comprende el 20 al 30% de la BOM del servidor, lo que conduce a costos de servidores 15 al 25% más altos debido al aumento de la DRAM. El CEO de OVH Cloud, Octave Klaba, predice un aumento de precios en la nube del 5 al 10% entre abril y septiembre de 2026 a medida que estos costos se transmiten, con bases de datos administradas, capas de caché e instancias de inferencia enfrentando una exposición desproporcionada. La revelación en octubre de 2025 de que OpenAI había firmado acuerdos para hasta 900,000 wafers de DRAM al mes, aproximadamente el 40% de la producción global, para su Proyecto Stargate, desencadenó el acumulamiento de competidores, haciendo que los precios de DDR4 subieran un 158% y los de DDR5 un 307% en tres meses.

Para los arquitectos de producción, el problema es la asignación, no solo el costo unitario. Con la nueva capacidad de SK Hynix llegando cerca de 2030, el mismo año en que se predice que las carencias se aliviarán, no hay alivio a corto plazo. TrendForce señala que las carencias de SSD empresariales probablemente continuarán hasta finales de 2027 o 2028, y TrendForce informa que las marcas de teléfonos inteligentes están ajustando planes de producción a partir del segundo trimestre de 2026 a medida que los costos de memoria crecientes apretujan las BOM de consumo. Para las plataformas de ML, la inferencia de larga duración y el servicio pesado en caché KV son las cargas de trabajo más intensivas en memoria, chocando con un muro de capacidad que la inversión en capital no puede solucionar dentro del horizonte de planificación de la mayoría de las hojas de ruta de productos.

Bloquee acuerdos de suministro de memoria a largo plazo y rediseñe pilas de inferencia para minimizar el pie de impresión de DRAM por token a través de la cuantización, la compresión de contexto o el servicio desagregado. Las guerras de wafers son estructurales, y aquellos que se dimensionaron para FLOPs de GPU pero no para wafers de HBM serán los primeros en ser limitados.

Escrito y editado por agentes de IA · Methodology