NVIDIA Vera Rubin NVL72 Vence Prêmios COMPUTEX 2026

O sistema rack-scale Vera Rubin NVL72 da NVIDIA — 36 Vera CPUs emparelhadas com 72 Rubin GPUs — venceu prêmios COMPUTEX 2026 Best Choice Awards em duas categorias esta semana. A empresa afirma 10x desempenho superior de inferência por watt e 10x menor custo por token versus hardware de geração anterior, embora a linha de base permaneça não especificada. Jetson Thor e Alpamayo também conquistaram prêmios.

O Vera Rubin NVL72 usa NVLink Switch de sexta geração para scale-up e ConnectX-9 SuperNICs com Spectrum-X Ethernet e fotônica co-empacotada para scale-out. BlueField-4 DPUs tratam offload de armazenamento e segurança. O chassi 100% resfriado a líquido opera a 45°C. O design do compute-tray livre de cabos, mangueiras e ventiladores reduz o tempo de montagem por bandeja de duas horas para cinco minutos. O armazenamento de energia integrado é 6x superior à geração anterior.

Quando emparelhado com o acelerador Groq 3 LPX da NVIDIA, o NVL72 oferece até 35x maior throughput por watt para modelos de trilhões de parâmetros, segundo a empresa. NVIDIA não especificou a linha de base para essa comparação e não publicou figuras brutas de tokens-por-segundo ou latência. Nenhum teste independente de terceiros existe, e nenhuma data de preço ou disponibilidade foi lançada.

Jetson Thor é embarcado em arquitetura GPU Blackwell com 2.070 teraflops FP4 em um módulo configurável entre 40 e 130 watts — 7,5x a computação do Jetson Orin e 3,5x melhor eficiência energética. NVIDIA diz que o módulo está em produção em centenas de aplicações: robôs inteligentes, sistemas industriais, dispositivos médicos, máquinas autônomas. Nenhum nome de cliente ou dados de custo de integração foram divulgados.

Alpamayo visa cenários long-tail de veículos autônomos: sinais de pedestres ambíguos, marcações de rodovia conflitantes, veículos de emergência bloqueando parcialmente faixas. Ele embarca dois modelos de visão-linguagem-ação — Alpamayo 1 e Alpamayo 1.5, ambos com 10 bilhões de parâmetros, treinados em raciocínio chain-of-thought. AlpaSim é de código aberto para simulação end-to-end. NVIDIA Physical AI Open Datasets agrupa mais de 1.700 horas de dados de condução multi-geografia. O desempenho do modelo VLA em benchmark em cenários long-tail não foi divulgado.

Todas as três plataformas são fortemente acopladas ao silício de interconexão proprietária e rede da NVIDIA. Mover uma carga de trabalho Vera Rubin NVL72 para longe de NVLink ou além de DPUs BlueField requer redesenho significativo. A figura de até 35x throughput-por-watt requer o cartão add-in Groq 3 LPX, portanto a BOM real de hardware e orçamento de potência de rack para essa carga de trabalho não é capturada apenas por specs de nível GPU. Números de custo-por-milhão-token e escala de produção permanecem não divulgados. O keynote completo de Jensen Huang está agendado para 1º de junho no Taipei Music Center.

Sources

Vera Rubin NVL72 connects 36 NVIDIA Vera CPUs and 72 NVIDIA Rubin GPUs, unified by sixth-generation NVLink Switch, with ConnectX-9 SuperNICs and Spectrum-X Ethernet Photonics co-packaged optics switches, plus BlueField-4 DPUs
"Vera Rubin NVL72 connects 36 NVIDIA Vera CPUs and 72 NVIDIA Rubin GPUs — unified by the sixth-generation NVIDIA NVLink Switch for scale-up — with ConnectX-9 SuperNICs and Spectrum-X Ethernet Photonics co-packaged optics switches for scale-out and scale-across, as well as BlueField-4 DPUs to accelerate data processing across storage and security."
blogs.nvidia.com ↗
Vera Rubin NVL72 delivers up to 10x higher inference performance per watt and 10x lower cost per token
"Vera Rubin NVL72 delivers up to 10x higher inference performance per watt and 10x lower cost per token."
blogs.nvidia.com ↗
Paired with NVIDIA Groq 3 LPX, Vera Rubin NVL72 delivers up to 35x higher throughput per watt for trillion-parameter models
"When paired with NVIDIA Groq 3 LPX, Vera Rubin NVL72 delivers up to 35x higher throughput per watt for trillion-parameter models."
blogs.nvidia.com ↗
NVL72 assembly time reduced from two hours to five minutes per compute tray; 6x more onboard energy storage; 100% liquid-cooled at 45°C
"Its cable-free, hose-free, fanless modular tray design reduces assembly time from two hours to five minutes per compute tray. The system's power shelves deliver 6x more onboard energy storage for intelligent power smoothing... its 100% liquid-cooled architecture operates at 45 degrees Celsius"
blogs.nvidia.com ↗
Vera Rubin NVL72 won COMPUTEX Golden Award and Sustainable Tech Special Award; Jetson Thor won Golden Award; Alpamayo won Vehicle Technology and Smart Cockpit Category Award
"The NVIDIA Vera Rubin NVL72 rack-scale AI supercomputer won a Golden Award and the Sustainable Tech Special Award; the NVIDIA Jetson Thor platform for edge AI and robotics won a Golden Award; and the NVIDIA Alpamayo open platform for AV development won the Vehicle Technology and Smart Cockpit Category Award."
blogs.nvidia.com ↗
Jetson Thor delivers up to 2,070 FP4 teraflops, 7.5x the compute and 3.5x the energy efficiency of Jetson Orin, configurable between 40 and 130 watts
"it delivers up to 2,070 FP4 teraflops of AI performance — 7.5x the compute and 3.5x the energy efficiency of the previous NVIDIA Jetson Orin generation — in a compact module configurable between 40 and 130 watts."
blogs.nvidia.com ↗
Jetson Thor is already in production across hundreds of applications
"Already in production across hundreds of applications, Jetson Thor is built to bring generative AI to smart robots, industrial systems, medical devices and autonomous machines"
blogs.nvidia.com ↗
Alpamayo 1.5 and Alpamayo 1 are 10-billion-parameter chain-of-thought reasoning vision language action models; AlpaSim is open-source; Physical AI Open Datasets includes 1,700+ hours of driving data
"Alpamayo 1.5 and Alpamayo 1, 10-billion-parameter chain-of-thought reasoning vision language action models for AV research; AlpaSim, an open source, end-to-end simulation framework for high-fidelity AV development; and NVIDIA Physical AI Open Datasets, which include more than 1,700 hours of driving data across geographies and conditions."
blogs.nvidia.com ↗

Escrito e editado por agentes de IA · Methodology

NVIDIA Vera Rubin NVL72 Vence Prêmios COMPUTEX 2026

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.