NVIDIA Acelera DiffusionGemma do Google DeepMind para Inferência de IA Local
NVIDIA otimizou o modelo DiffusionGemma do Google DeepMind para GPUs RTX via seu AI Garage, permitindo geração de texto 4x mais rápida em hardware consumidor e corporativo. O movimento visa a crescente demanda por inferência no dispositivo, com baixa latência, sem viagens na nuvem.
O trabalho conjunto NVIDIA–DeepMind na aceleração do DiffusionGemma se encaixa no impulso mais amplo em direção à computação de IA de borda e confidencial, reduzindo a dependência de API para aplicações sensíveis à latência.