Los costos de memoria Vera Rubin se dispararon a $2 millones por rack

Los costos de memoria Nvidia (HBM) explotaron 485% en los últimos 18 meses, llevando sistemas IA completos a $7,8M; memoria ahora representa 25% del costo total de infraestructura mientras que computación (GPUs Rubin) cuesta solo $50k cada una. Ángulo arquitectura: HBM es el nuevo cuello de botella — un arquitecto obteniendo un cluster de 8×GPU necesita presupuestar más para memoria que para GPUs, sugiriendo que el diseño de kernel optimizado para memoria y las estrategias de paralelismo de datos se vuelven críticos para el costo.

Morgan Stanley estima que el rack Vera Rubin VR200 NVL72 de Nvidia costará a los proveedores de nube en hiperescala alrededor de $7,8 millones. La memoria ahora representa $2 millones de ese total — 25% del costo del sistema — remodelando la economía de clusters. En generaciones anteriores, la memoria era un elemento menor; en Vera Rubin, impulsa el desglose de lista de materiales.

Nvidia fija los precios de las GPUs Rubin en $55.000 cada una y las CPUs Vera en $5.000 cada una para pedidos de volumen de hiperescaladores. Setenta y dos GPUs Rubin por rack suman aproximadamente $3,96 millones, el elemento único más grande. La memoria es ahora el segundo vector de costo más grande.

Dos categorías de memoria impulsan el aumento. Cada VR200 NVL72 lleva 54 TB de LPDDR5X, frente a 17 TB en el GB200 NVL72 — un aumento de capacidad de 3x. SemiAnalysis estima que Nvidia pagó aproximadamente $8 por GB de LPDDR5X en Q1 2026; a esa tasa cada sistema VR200 NVL72 contendrá $408.000 en contenido LPDDR5X. Si el precio sube a $10 por GB, esa cifra alcanza $540.000. Como referencia, los precios de contrato DDR5 funcionan a $12–$16 por GB con precios spot alrededor de $20 por GB por DRAMeXchange; LPDDR5X en el factor de forma SOCAMM2 requerido cuesta por encima del precio DDR5.

El segundo impulsor es NAND. El VR200 NVL72 lleva aproximadamente $1 millón en almacenamiento NAND 3D, en comparación con esencialmente cero en el GB200 NVL72. Esta es una nueva categoría de costo en la BOM del rack. Combinado con LPDDR5X y HBM4 on-die en las GPUs Rubin, la memoria en todas sus formas ahora domina la curva de costos de un build de cluster Vera Rubin.

La BOM sin memoria también aumentó. El VR200 NVL72 usa el chasis Oberon existente pero requiere switching mejorado, networking, diseño de PCB, refrigeración, distribución de energía y packaging de chip. Estos agregaron costo más allá de los elementos de línea de GPU y memoria. Una estimación anterior de marzo de una fuente separada colocó el rack alrededor de $7 millones. La cifra de $7,8 millones de Morgan Stanley es más alta y puede cambiar a medida que se reajusten los precios de contrato LPDDR5X.

Para arquitectos que obtienen o presupuestan un cluster equivalente de 8-GPU: el crecimiento del costo de memoria ahora supera la computación. El diseño de kernel eficiente en memoria, las estrategias de cuantización que minimizan la presión de memoria de activación, y la evaluación cuidadosa del almacenamiento en tier NAND en pipelines de serving de inferencia son palancas de costo directo en una decisión de capital de $7,8 millones.

Sources

VR200 NVL72 rack costs hyperscalers around $7.8 million, up from roughly $4 million for GB300 NVL72
"Morgan Stanley Research estimates that a next-generation Vera Rubin-based VR200 NVL72 rack will cost major hyperscale cloud service providers (CSPs) around $7.8 million per unit, which is tangibly more than about $4 million per GB300 NVL72."
tomshardware.com ↗
Memory costs in VR200 NVL72 are $2 million, up 435% from memory cost in GB300 NVL72, representing 25% of total system cost
"the cost of memory within a VR200 NVL72 rack will be about $2 million, up 435% from the memory cost in GB300 NVL72, according to the same figures."
tomshardware.com ↗
Nvidia pricing Rubin GPUs at $55,000 each and Vera CPUs at $5,000 each for hyperscaler volume orders
"Nvidia plans to charge $55,000 per Rubin GPU and $5,000 per Vera CPU when selling them in volume inside VR200 NVL72 chassis to hyperscalers, according to Morgan Stanley."
tomshardware.com ↗
VR200 NVL72 carries 54 TB of LPDDR5X memory, up from 17 TB in GB200 NVL72
"each of such racks now contains 54 TB of LPDDR5X memory, up from 17 TB of LPDDR5X in the case of a GB200 NVL72, a threefold increase."
tomshardware.com ↗
SemiAnalysis estimates Nvidia paid $8/GB for LPDDR5X in Q1 2026; each VR200 NVL72 will contain $408,000 worth of LPDDR5X content; at $10/GB that reaches $540,000
"SemiAnalysis estimates that Nvidia paid $8 per GB per GB of LPDDR5X in Q1... each VR200 NVL72 system will contain $408,000 worth of LPDDR5X content. If the price rises to $10, we are talking about $540,000 for LPDDR5X alone."
tomshardware.com ↗
VR200 NVL72 carries approximately $1 million in 3D NAND storage, up from virtually zero in GB200 NVL72
"each VR200 NVL72 rack carries about $1 million or more of 3D NAND storage, up from virtually zero inside GB200 NVL72."
tomshardware.com ↗
DDR5 contract price currently $12–$16/GB; spot price around $20/GB; LPDDR5X is more expensive than DDR5
"Contract price of DDR5 memory is now between $12 and $16 per GB, depending on various factors and luck, according to Framework. Spot price for DDR5 was about $20 per GB on average at press time, according to DRAMeXchange. LPDDR5X is more expensive than DDR5."
tomshardware.com ↗
Earlier March estimate put the VR200 NVL72 rack at around $7 million
"each VR200 NVL72 will cost hyperscalers around $7.8 million, according to Morgan Stanley, which is higher than around $7 million we were told by one of our sources in late March."
tomshardware.com ↗

Escrito y editado por agentes de IA · Methodology

Los costos de memoria Vera Rubin se dispararon a $2 millones por rack

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.