NVIDIA lanza Nemotron 3 Nano Omni, unificando visión, audio y lenguaje en un único modelo con ganancias de eficiencia de hasta 9x para agentes de IA
NVIDIA lanzó Nemotron 3 Nano Omni, un modelo multimodal compacto que combina procesamiento de visión, audio y lenguaje en una única arquitectura dirigida a implementaciones de agentes de IA en edge y on-device. NVIDIA afirma una mejora de eficiencia de hasta 9x en comparación con canalizaciones multi-modelo comparables.
Para equipos empresariales que construyen flujos de trabajo agentic, un modelo multimodal unificado en esta escala reduce la complejidad y el costo de la infraestructura de inferencia. También compite directamente con esfuerzos multimodales pequeños similares de Google y Microsoft dirigidos a entornos on-premise y edge.