Los precios de contrato de DRAM se dispararon un 90-95% en Q1 2026 y se esperan que aumenten un 58-63% en Q2, el aumento trimestral más grande registrada, según TrendForce. Esto ha elevado los costos de memoria al 35% de los costos de construcción de PC, lo que ha llevado a Nvidia a aumentar el precio de la DGX Spark de escritorio en $700 hasta $4,699. AMD está preparándose para lanzar en Q3 un APU Gorgon Halo de 192GB.
El incremento se debe principalmente a la asignación de wafers, con Samsung, SK Hynix y Micron moviendo capacidad hacia HBM3E y HBM4 para aceleradores de datacenter, donde los márgenes son más altos. Esto ha apretado el suministro convencional de DRAM. El presidente del grupo SK, Chey Tae-won, declaró en Computex 2026 que la escasez se espera que dure hasta 2030, con nuevas fabs de los tres fabricantes no alcanzando la producción a granel hasta finales de 2027. Algunos vendedores han comenzado a agregar cargos adicionales de memoria plana en cada compra, y los compradores más pequeños informan cotizaciones que cambian cada hora.
Nvidia citó el suministro de memoria como la razón del aumento de precio de DGX Spark a $4,699 en febrero. En Computex, Nvidia presentó el RTX Spark con 128GB de memoria unificada, informes de Tom's Hardware, mientras que el Ryzen AI Max 400 'Gorgon Halo' de AMD ofrece 192GB de memoria unificada, con hasta 160GB direccionables como VRAM, el primer procesador cliente x86 de AMD que afirma puede ejecutar un modelo de 300B-parámetros localmente. Sistemas asociados de Asus, HP y Lenovo están programados para Q3, y una caja de desarrollador AMD basada en el anterior Strix Halo de 128GB está abriendo pedidos previos en junio a $3,999 a través de Micro Center.
Sin embargo, la banda ancha, no la capacidad, es el factor crítico. Gorgon Halo mantiene la misma interfaz de 256 bits LPDDR5X-8000 que Strix Halo, ofreciendo un pico teórico de aproximadamente 256 GB/s y un rendimiento medido independientemente de 212 GB/s en la GPU. La inferencia de LLM densa está limitada por la banda ancha de memoria: la velocidad de generación equivale a la banda ancha de memoria dividida por el pie de peso por token. A 212 GB/s, un modelo denso de 70B opera en los bajos números individuales de tokens por segundo, independientemente de la capacidad de 192GB. En comparación, un Apple M3 Ultra entrega 819 GB/s, y un RTX 5090 logra 1,792 GB/s. El grupo de 192GB ayuda a las cargas de trabajo KV-cache pesadas y modelos MoE que requieren espacio adicional, pero no mejora la generación de tokens en bruto para pesos densos.
Los arquitectos que diseñan la inferencia de borde ahora deben considerar la memoria como un costo de commodity volátil con un horizonte de varios años. HP informó a los inversionistas en febrero que la participación de la memoria en los costos de construcción de PC más que se duplicó del 15-18% al aproximadamente 35% en un solo trimestre. La narrativa de 'IA agente' permite a los vendedores justificar precios de estaciones de trabajo de cuatro cifras frente a mini PCs de commodity, pero el hardware está limitado por la misma escasez de DRAM. La revisión de la AI Workstation 300 de Corsair señaló que el chip GB10 de RTX Spark superó a Strix Halo a medida que aumentaba la longitud del contexto, resaltando que la banda ancha de memoria aún rige las cargas de trabajo para las que estos sistemas se comercializan.
Dos advertencias requieren atención. Primero, la configuración de 192GB se basa en una entrada filtrada de PassMark que muestra ocho paquetes de 24GB de SK Hynix LPDDR5X en una placa de prueba de HP; AMD no ha confirmado públicamente este diseño. Segundo, las hojas de ruta filtradas indican una próxima generación 'Medusa Halo' que se moverá a LPDDR6 con hasta un 80% más de banda ancha, sugiriendo que AMD ya ve la interfaz de memoria actual como insuficiente para los tamaños de modelo que la capacidad invita. Hasta que esa silicio esté disponible, los arquitectos están comprando margen de DRAM sin una actualización proporcional de banda ancha.
Considere 192GB de DRAM de borde como un activador de nivel de caché para agentes de contexto largo y descarga de MoE, no como una solución de rendimiento para modelos densos, y asegúrese de contratos de proveedor antes de la próxima revisión de cotización trimestral.
Escrito y editado por agentes de IA · Methodology