INDUSTRYPOR AI|EXPERT SCOUT· sexta-feira, 22 de maio de 2026· 4 MIN DE LEITURA
NVIDIA Vera Rubin NVL72 Vence Prêmios COMPUTEX 2026
NVIDIA revelou atualizações de produtos e plataforma no GTC Taipei durante COMPUTEX, possivelmente incluindo anúncios de hardware de inferência e stack de software. Ângulo arquitetura: fique atento aos novos números de throughput/potência e metas de implantação (automotivo, edge, cloud) que redesenharão roadmaps de infraestrutura.
Generative Imagery
Vera Rubin NVL72 da NVIDIA empilha ganhos de eficiência.FIG. 01
O sistema rack-scale Vera Rubin NVL72 da NVIDIA — 36 Vera CPUs emparelhadas com 72 Rubin GPUs — venceu prêmios COMPUTEX 2026 Best Choice Awards em duas categorias esta semana. A empresa afirma 10x desempenho superior de inferência por watt e 10x menor custo por token versus hardware de geração anterior, embora a linha de base permaneça não especificada. Jetson Thor e Alpamayo também conquistaram prêmios.
O Vera Rubin NVL72 usa NVLink Switch de sexta geração para scale-up e ConnectX-9 SuperNICs com Spectrum-X Ethernet e fotônica co-empacotada para scale-out. BlueField-4 DPUs tratam offload de armazenamento e segurança. O chassi 100% resfriado a líquido opera a 45°C. O design do compute-tray livre de cabos, mangueiras e ventiladores reduz o tempo de montagem por bandeja de duas horas para cinco minutos. O armazenamento de energia integrado é 6x superior à geração anterior.
Quando emparelhado com o acelerador Groq 3 LPX da NVIDIA, o NVL72 oferece até 35x maior throughput por watt para modelos de trilhões de parâmetros, segundo a empresa. NVIDIA não especificou a linha de base para essa comparação e não publicou figuras brutas de tokens-por-segundo ou latência. Nenhum teste independente de terceiros existe, e nenhuma data de preço ou disponibilidade foi lançada.
Jetson Thor é embarcado em arquitetura GPU Blackwell com 2.070 teraflops FP4 em um módulo configurável entre 40 e 130 watts — 7,5x a computação do Jetson Orin e 3,5x melhor eficiência energética. NVIDIA diz que o módulo está em produção em centenas de aplicações: robôs inteligentes, sistemas industriais, dispositivos médicos, máquinas autônomas. Nenhum nome de cliente ou dados de custo de integração foram divulgados.
Alpamayo visa cenários long-tail de veículos autônomos: sinais de pedestres ambíguos, marcações de rodovia conflitantes, veículos de emergência bloqueando parcialmente faixas. Ele embarca dois modelos de visão-linguagem-ação — Alpamayo 1 e Alpamayo 1.5, ambos com 10 bilhões de parâmetros, treinados em raciocínio chain-of-thought. AlpaSim é de código aberto para simulação end-to-end. NVIDIA Physical AI Open Datasets agrupa mais de 1.700 horas de dados de condução multi-geografia. O desempenho do modelo VLA em benchmark em cenários long-tail não foi divulgado.
Todas as três plataformas são fortemente acopladas ao silício de interconexão proprietária e rede da NVIDIA. Mover uma carga de trabalho Vera Rubin NVL72 para longe de NVLink ou além de DPUs BlueField requer redesenho significativo. A figura de até 35x throughput-por-watt requer o cartão add-in Groq 3 LPX, portanto a BOM real de hardware e orçamento de potência de rack para essa carga de trabalho não é capturada apenas por specs de nível GPU. Números de custo-por-milhão-token e escala de produção permanecem não divulgados. O keynote completo de Jensen Huang está agendado para 1º de junho no Taipei Music Center.