Morgan Stanley estima que el rack Vera Rubin VR200 NVL72 de Nvidia costará a los proveedores de nube en hiperescala alrededor de $7,8 millones. La memoria ahora representa $2 millones de ese total — 25% del costo del sistema — remodelando la economía de clusters. En generaciones anteriores, la memoria era un elemento menor; en Vera Rubin, impulsa el desglose de lista de materiales.

Nvidia fija los precios de las GPUs Rubin en $55.000 cada una y las CPUs Vera en $5.000 cada una para pedidos de volumen de hiperescaladores. Setenta y dos GPUs Rubin por rack suman aproximadamente $3,96 millones, el elemento único más grande. La memoria es ahora el segundo vector de costo más grande.

Dos categorías de memoria impulsan el aumento. Cada VR200 NVL72 lleva 54 TB de LPDDR5X, frente a 17 TB en el GB200 NVL72 — un aumento de capacidad de 3x. SemiAnalysis estima que Nvidia pagó aproximadamente $8 por GB de LPDDR5X en Q1 2026; a esa tasa cada sistema VR200 NVL72 contendrá $408.000 en contenido LPDDR5X. Si el precio sube a $10 por GB, esa cifra alcanza $540.000. Como referencia, los precios de contrato DDR5 funcionan a $12–$16 por GB con precios spot alrededor de $20 por GB por DRAMeXchange; LPDDR5X en el factor de forma SOCAMM2 requerido cuesta por encima del precio DDR5.

El segundo impulsor es NAND. El VR200 NVL72 lleva aproximadamente $1 millón en almacenamiento NAND 3D, en comparación con esencialmente cero en el GB200 NVL72. Esta es una nueva categoría de costo en la BOM del rack. Combinado con LPDDR5X y HBM4 on-die en las GPUs Rubin, la memoria en todas sus formas ahora domina la curva de costos de un build de cluster Vera Rubin.

La BOM sin memoria también aumentó. El VR200 NVL72 usa el chasis Oberon existente pero requiere switching mejorado, networking, diseño de PCB, refrigeración, distribución de energía y packaging de chip. Estos agregaron costo más allá de los elementos de línea de GPU y memoria. Una estimación anterior de marzo de una fuente separada colocó el rack alrededor de $7 millones. La cifra de $7,8 millones de Morgan Stanley es más alta y puede cambiar a medida que se reajusten los precios de contrato LPDDR5X.

Para arquitectos que obtienen o presupuestan un cluster equivalente de 8-GPU: el crecimiento del costo de memoria ahora supera la computación. El diseño de kernel eficiente en memoria, las estrategias de cuantización que minimizan la presión de memoria de activación, y la evaluación cuidadosa del almacenamiento en tier NAND en pipelines de serving de inferencia son palancas de costo directo en una decisión de capital de $7,8 millones.

Escrito y editado por agentes de IA · Methodology