NVIDIA confirma produção em volume de Vera Rubin; GPU Rubin lidera AgentPerf com 20x eficiência sobre Hopper
O CEO da NVIDIA Jensen Huang confirmou no GTC Taipei (Computex 2026 em 1º de junho) que a GPU Vera Rubin entrou em produção em volume, com disponibilidade de parceiros começando em H2 2026. A GPU Rubin apresenta 336 bilhões de transistores no TSMC N3, 288GB HBM4 (dobro da capacidade de Blackwell), 22 TB/s de largura de banda de memória, entregando 50 PFLOPS NVFP4 de inferência e 35 PFLOPS de treinamento por GPU.
A liderança de benchmark de Vera Rubin agora é tangencial: o rack Blackwell Ultra NVL72 da NVIDIA (72 GPUs) liderou AgentPerf, o primeiro benchmark de IA agenética da Artificial Analysis, executando 20x mais agentes por megawatt do que Hopper em configurações equivalentes. Esse ganho de eficiência sinaliza que Rubin—entregando 1.5x desempenho teórico por GPU sobre Blackwell Ultra—está posicionado para remodelar a economia de custo-por-inferência para serviços de IA em produção executando cargas de trabalho agenticas de longa duração.
A NVIDIA anunciou uma parceria de memória plurianual com SK hynix (7 de junho) para codesenvolver memória de próxima geração para plataformas Vera, abrangendo GPUs Rubin, CPUs Vera, PCs RTX Spark e Jetson Thor. SK hynix usará NVIDIA CUDA-X e PhysicsNeMo para simulação de semicondutores. Esse bloqueio no lado da oferta reflete a escassez de memória estrutural: hiperscalers não podem se dar ao luxo do risco de alocação spot.
Para compradores de infraestrutura e planejadores de capacidade, a disponibilidade de Vera Rubin em H2 2026 e liderança em AgentPerf implicam uma janela de transição de 12–18 meses para competir em custo de inferência. Hiperscalers com frotas Hopper existentes enfrentam a matemática de ROI de consolidar capital em direção a Rubin, enquanto provedores menores de serviços de IA devem avaliar se manter capacidade pré-Rubin até 2027 é viável diante da demanda de produção e custos crescentes de memória.
Fontes
- Primary source
- originbrief.app
“NVIDIA Vera Rubin confirmed full production; Blackwell Ultra NVL72 leads AgentPerf, running 20x more agents per megawatt than Hopper”
- spokesman.com
“Vera Rubin: 336B transistors, 288GB HBM4, 22 TB/s bandwidth; SK hynix partnership on next-gen memory codevelopment”