DiffusionGemma de Google DeepMind ofrece generación de texto 4x más rápida
Google DeepMind lanzó DiffusionGemma, un nuevo modelo generativo que permite generación de texto 4x más rápida mediante un enfoque de decodificación basado en difusión comparado con modelos autoregresivos estándar. La técnica intercambia latencia por compromisos de calidad, posicionando la difusión como una avenida potencial para inferencia de baja latencia en aplicaciones de IA de borde y consumidor.