NVIDIA varre MLPerf Training 6.0; GB300 executa DeepSeek-V3 em 2,02 minutos em 8.192 GPUs
NVIDIA dominou o MLPerf Training v6.0, o benchmark de padrão da indústria publicado em 16 de junho, publicando o tempo mais rápido para treinamento em cada benchmark e o melhor desempenho por acelerador em todos os testes. A empresa foi o único fornecedor a enviar resultados em todos os sete benchmarks da suite, incluindo novos testes de pré-treinamento de mistura de especialistas (MoE) para DeepSeek-V3 e GPT-OSS-20B que refletem tendências atuais no desenvolvimento de modelos em larga escala.
CoreWeave alcançou o tempo de treinamento mais rápido no maior modelo da suite: DeepSeek-V3 671B treinado ao alvo de qualidade em 2,02 minutos em escala de 8.192 GPUs usando sistemas GB300 NVL72 conectados com rede Spectrum-X. Microsoft Azure dimensionou Llama 3.1 405B para 8.192 GPUs usando GB200 NVL72, atingindo o alvo de referência em 7,07 minutos. Os sistemas Blackwell Ultra GB300 da NVIDIA demonstraram desempenho 60% mais rápido que GB200 no mesmo fator de forma NVL72.
Para equipes de infraestrutura de IA, a varreção completa valida a arquitetura full-stack do Blackwell (hardware, comutação NVLink, rede Spectrum-X e stacks de software CUDA) em escala de milhães de GPUs. A ausência de envíos competitivos em cargas de trabalho MoE sinaliza que outros fornecedores de GPUs carecem de maturidade de software para treinar em escala em arquiteturas de modelo de próxima geração. O desempenho em escala de rack agora é tão importante quanto as métricas por acelerador: hipernuvens se importam com vazão por quilowatt e tempo de prontidão do modelo, não apenas FLOPS brutos.
Fontes
- Primary source
- developer.nvidia.com
“NVIDIA achieved leading results by winning every benchmark, setting records in both overall and per-accelerator performance, scaling up to 8,192 Blackwell Ultra GPUs”
- wccftech.com
“CoreWeave delivered the fastest time to train for DeepSeek-V3 671B, reaching the quality target in 2.02 minutes at 8,192-GPU scale using GB300 NVL72 systems”