NVIDIA Cosmos 3 adiciona geração de ações de robô a world models para deploy mais rápido de physical AI
NVIDIA lançou Cosmos 3 na Computex 2026, uma world foundation model que gera dados de cena sintéticos e saídas de ação de robô para sistemas autônomos. Diferente de world models apenas-visão anteriores, Cosmos 3 emite dados numéricos de robô—ângulos de junta, posições de pinaça, pontos de trajetória—diretamente usáveis em pipelines de planejamento e controle. O modelo também gera sequências de vídeo fisicamente plausíveis para dados de treinamento sintéticos, permitindo equipes de robótica praticarem cenários raros ou caros do mundo real sem hardware.
O modelo é enviado em formato OpenMDW-1.1, um framework de empacotamento unificado cobrindo artefatos de modelo, código, documentação e dados com acesso através de repositórios NVIDIA e NIM (NVIDIA Inference Microservices). Essa padronização aborda um atrito chave de adoção: roboticistas previamente malabaristas formatos de modelo incompatíveis entre camadas de simulação, visão e controle. A geração de ação nativa de Cosmos 3 comprime o pipeline de saída de modelo para especificação de tarefa de robô.
Para equipes de robótica e sistemas autônomos, isso importa porque generalização sim-para-real permanece o gargalo. Ao gerar ações de robô fundamentadas durante treinamento, equipes podem reduzir coleta de dados do mundo real—um direcionador de custo conhecido em physical AI—enquanto mantendo performance de deploy. NVIDIA está explicitamente posicionando Cosmos 3 como software de engenharia deployável, não outro chatbot; espere integração mais profunda em stacks OEM de robótica e fluxos de trabalho de gêmeos digitais fechados dentro de 6-12 meses.