NVIDIA Acelera DiffusionGemma de Google DeepMind para Inferencia de IA Local
NVIDIA ha optimizado el modelo DiffusionGemma de Google DeepMind para GPUs RTX a través de su AI Garage, permitiendo generación de texto 4x más rápida en hardware consumidor y empresarial. El movimiento apunta a la creciente demanda de inferencia en dispositivo, baja latencia, sin viajes a la nube.
El trabajo conjunto NVIDIA–DeepMind en la aceleración del DiffusionGemma se ajusta al impulso más amplio hacia la computación de IA de borde y confidencial, reduciendo la dependencia de API para aplicaciones sensibles a la latencia.