NVIDIA Cosmos 3 añade generación de acción de robot a world models para despliegue más rápido de physical AI
NVIDIA lanzó Cosmos 3 en Computex 2026, una world foundation model que genera tanto datos de escena sintéticos como salidas de acción de robot para sistemas autónomos. A diferencia de los world models solo de visión anteriores, Cosmos 3 emite datos numéricos de robot—ángulos de articulación, posiciones de pinza, puntos de trayectoria—directamente utilizables en tuberías de planificación y control. El modelo también genera secuencias de video físicamente plausibles para datos de entrenamiento sintético, permitiendo a equipos de robótica practicar escenarios del mundo real raros o costosos sin hardware.
El modelo se envía en formato OpenMDW-1.1, un marco de empaque unificado que cubre artefactos de modelo, código, documentación y datos con acceso a través de repositorios NVIDIA y NIM (NVIDIA Inference Microservices). Esta estandarización aborda una fricción clave de adopción: los roboticistas previamente malabaristas formatos de modelo incompatibles en capas de simulación, visión y control. La generación nativa de acción de Cosmos 3 comprime la tubería desde la salida del modelo hasta la especificación de tarea del robot.
Para equipos de robótica y sistemas autónomos, esto importa porque la generalización de sim a real sigue siendo el cuello de botella. Al generar acciones de robot fundamentadas durante el entrenamiento, los equipos pueden reducir la recopilación de datos del mundo real—un impulsor de costos conocido en physical AI—mientras se mantiene el rendimiento de despliegue. NVIDIA está posicionando explícitamente Cosmos 3 como software de ingeniería desplegable, no otro chatbot; espere integración más profunda en pilas OEM de robótica y flujos de trabajo de gemelos digitales cerrados dentro de 6-12 meses.