INDUSTRYPOR AI|EXPERT SCOUT· quinta-feira, 21 de maio de 2026· 3 MIN DE LEITURA
Custos de memória Vera Rubin dispararam para $2 milhões por rack
Custos de memória Nvidia (HBM) explodiram 485% nos últimos 18 meses, levando sistemas IA completos a $7,8M; memória agora representa 25% do custo total de infraestrutura enquanto computação (GPUs Rubin) custa apenas $50k cada. Ângulo arquitetura: HBM é o novo gargalo — um arquiteto obtendo um cluster de 8×GPU precisa orçar mais para memória do que GPUs, sugerindo que design de kernel otimizado para memória e estratégias de paralelismo de dados se tornam críticos para custo.
Generative Imagery
Custos de memória agora superam o preço das GPUs em clusters IA em hiperescalaFIG. 01
Morgan Stanley estima que o rack Vera Rubin VR200 NVL72 da Nvidia custará aos provedores de nuvem em hiperescala cerca de $7,8 milhões. Memória agora representa $2 milhões desse total — 25% do custo do sistema — remodelando a economia de clusters. Em gerações anteriores, memória era um item menor; em Vera Rubin, ela impulsiona o detalhamento da lista de materiais.
Nvidia precifica GPUs Rubin a $55.000 cada e CPUs Vera a $5.000 cada para pedidos de volume de hiperescaladores. Setenta e dois GPUs Rubin por rack resultam em aproximadamente $3,96 milhões, o maior item isolado. Memória é agora o segundo maior vetor de custo.
Duas categorias de memória impulsionam o aumento. Cada VR200 NVL72 carrega 54 TB de LPDDR5X, acima dos 17 TB no GB200 NVL72 — um aumento de capacidade de 3x. SemiAnalysis estima que Nvidia pagou aproximadamente $8 por GB de LPDDR5X em Q1 2026; nessa taxa cada sistema VR200 NVL72 conterá $408.000 em conteúdo LPDDR5X. Se o preço subir para $10 por GB, essa cifra atinge $540.000. Para referência, preços de contrato DDR5 correm $12–$16 por GB com preços spot em torno de $20 por GB pela DRAMeXchange; LPDDR5X no fator de forma SOCAMM2 obrigatório custa acima do preço DDR5.
O segundo driver é NAND. O VR200 NVL72 carrega aproximadamente $1 milhão em armazenamento NAND 3D, comparado a praticamente zero no GB200 NVL72. Esta é uma nova categoria de custo na BOM do rack. Combinado com LPDDR5X e HBM4 on-die nos GPUs Rubin, memória em todas suas formas agora domina a curva de custo de um build de cluster Vera Rubin.
BOM sem memória também aumentou. O VR200 NVL72 usa o chassis Oberon existente mas requer switching melhorado, networking, design de PCB, resfriamento, entrega de energia e packaging de chip. Estes adicionam custo além dos itens de linha GPU e memória. Uma estimativa anterior de março de uma fonte separada colocou o rack em torno de $7 milhões. A figura de $7,8 milhões da Morgan Stanley é maior e pode mudar conforme preços de contrato LPDDR5X se redefinem.
Para arquitetos obtendo ou orçando um cluster equivalente de 8-GPU: crescimento de custo de memória agora supera computação. Design de kernel eficiente em memória, estratégias de quantização que minimizam pressão de memória de ativação, e avaliação cuidadosa de armazenamento em tier NAND em pipelines de serving de inferência são alavancas diretas de custo em uma decisão de capital de $7,8 milhões.