DiffusionGemma do Google DeepMind oferece geração de texto 4x mais rápida
Google DeepMind lançou DiffusionGemma, um novo modelo generativo que permite geração de texto 4x mais rápida via abordagem de decodificação baseada em difusão em comparação com modelos autogressivos padrão. A técnica troca latência por compromissos de qualidade, posicionando difusão como avenida potencial para inferência de baixa latência em aplicações de IA de borda e consumidor.