Plataforma NVIDIA Blackwell chega; GPUs B200/B300 com velocidade de inferência 4x mais rápida que H100, custo/energia 25x menores
NVIDIA anunciou a plataforma Blackwell em 11 de junho de 2026 no GTC, marcando a chegada de sua arquitetura de GPU de próxima geração projetada para alimentar IA gerativa em tempo real em escala. O portfólio Blackwell inclui GPUs B200 (192GB HBM3e, 8 TB/s de largura de banda, suporte nativo a FP4) e B300 Blackwell Ultra (288GB HBM3e), oferecendo inferência LLM até 4 vezes mais rápida do que NVIDIA H100 e consumo de custo e energia 25 vezes menor em comparação com seu antecessor Hopper.
A oferta principal é o Superchip GB200 Grace Blackwell, emparelhando dois GPUs B200 com CPUs NVIDIA Grace sobre NVLink 900GB/s, e o sistema rack GB300 NVL72 com 72 GPUs Blackwell Ultra e 36 CPUs Grace otimizados para escalonamento de tempo de teste e IA agência de raciocínio. NVIDIA também anunciou projeto DIGITS, um supercomputador de IA pessoal com o Superchip GB10 Grace Blackwell, trazendo desempenho de IA em escala petaflop para desenvolvedores individuais para prototipagem e ajuste fino.
A adoção inicial é ampla: Amazon Web Services, Google, Microsoft, Meta, OpenAI, Oracle, Tesla e xAI estão entre os primeiros clientes. Parceiros de OEM, incluindo Cisco, Dell, HPE, Lenovo e Supermicro, estão enviando variantes de workstation e servidor RTX PRO Blackwell. Provedores de nuvem devem começar a oferecer instâncias Blackwell dentro do trimestre, embora restrições de alocação provavelmente persistam até H2 2026.
Para arquitetos: Blackwell representa a primeira mudança de plataforma completa de Hopper—não apenas GPU, mas CPU integrada (Grace), rede (Quantum-X800 em 800Gb/s) e software (microserviços de inferência NVIDIA NIM, TensorRT-LLM, novo framework de serviço de inferência Dynamo para escalonamento de tempo de teste). Orçamento do planejamento de infraestrutura assumindo ciclo de 1 ano: NVIDIA anunciou que Rubin (próxima geração) chegará em 2027, e a empresa formalizou ciclos de lansação de GPU anuais, mudando de ciclo de dois anos. Memória e potência permanecem restrições; comece conversás de procurement agora para H2 2026 e além.
Fontes
- Primary source
- NVIDIA Blackwell RTX PRO Workstations and Servers
“NVIDIA Blackwell RTX PRO series redefines workflows for AI, technical, creative, engineering and design professionals”
- NVIDIA Project DIGITS: Personal AI Supercomputer
“Project DIGITS features the new NVIDIA GB10 Grace Blackwell Superchip, offering a petaflop of AI computing performance”
- NVIDIA Blackwell Ultra AI Factory Platform
“NVIDIA GB300 NVL72 connects 72 Blackwell Ultra GPUs and 36 Grace CPUs for test-time scaling”