La escasez de HBM impulsada por IA aprieta los precios de GPU; RTX 5090 se acerca a $5K a fin de año
La escasez de memoria es ahora la restricción dominante en la oferta y precios de GPU en segmentos de consumidor y empresariales. IDC y analistas de la cadena de suministro informan que la demanda de hiperscaler de memoria de ancho de banda (HBM3E, HBM4) ha creado una reasignación estructural de la producción de semiconductores lejos de la electrónica de consumo: cada oblea asignada a pilas HBM para aceleradores Nvidia H100/H200 se niega a LPDDR5X para teléfonos inteligentes o DDR5 para PC. HBM es el cuello de botella, con SK Hynix controlando la mayor parte del suministro y la capacidad CoWoS de TSMC completamente asignada hasta mediados de 2027.
Nvidia está reduciendo la producción de la serie GeForce RTX 50 en un 30-40% en H1 2026 debido a restricciones de GDDR7 y HBM, mientras que los precios de GPU del servidor están subiendo bruscamente: se espera que el H200 de Nvidia ($30-40K) aumente ~20% en 2026 a medida que los costos de los componentes HBM3E aumenten. Las tarjetas de consumidor insignia como la RTX 5090 podrían alcanzar $5,000 a fin de año, con tiempos de entrega extendéndose de 3-7 meses en toda la industria. Los proveedores de PC (Lenovo, Dell, HP, ASUS) advierten sobre aumentos de precios del 15-20% en H2 2026 a medida que el ciclo de actualización del fin de vida de Windows 10 choca con restricciones de memoria sostenidas.
Para equipos de infraestructura, esto no es una disrupción cíclica sino un reinicio estructural: las cargas de trabajo de IA requieren mucha más memoria por GPU que las cargas de trabajo de consumo, y los pedidos forward de hiperscalers de 2025 por miles de millones de dólares para GPU Blackwell han abarrotado las asignaciones de mercado medio y empresarial. La disponibilidad de memoria, no el silicio de GPU, es ahora la restricción vinculante. Los equipos que planifican implementaciones de inferencia en 2026 deben modelar cuantización FP8, orquestación de GPU multi-proveedor y hardware de generación anterior (A100, L40S) como estrategias de mitigación de costos.