NVIDIA lança Nemotron 3 Nano Omni, unificando visão, áudio e linguagem em um único modelo com ganhos de eficiência de até 9x para agentes de IA
A NVIDIA lançou Nemotron 3 Nano Omni, um modelo multimodal compacto que combina processamento de visão, áudio e linguagem em uma única arquitetura direcionada para implantações de agentes de IA em edge e on-device. A NVIDIA afirma melhoria de eficiência de até 9x em comparação com pipelines multi-modelo equivalentes.
Para equipes corporativas construindo fluxos de trabalho agentic, um modelo multimodal unificado nesta escala reduz a complexidade e o custo da infraestrutura de inferência. Também compete diretamente com esforços multimodais pequenos similares do Google e Microsoft direcionados para ambientes on-premise e edge.