Google TPU Geração 8 projetada para agentes e treinamento de modelos SOTA
Google revelou sua 8ª geração TPU (Tensor Processing Unit) otimizada para cargas de trabalho de agentes e treinamento de modelos state-of-the-art (SOTA). A nova arquitetura apresenta largura de banda de memória aprimorada, suporte melhorado para esparsidade e otimizações de multiplicação de matriz em escala visando padrões de inferência agêntica e treinamento de contexto longo.
O lançamento ressalta a tentativa de Google de defender sua participação no mercado de acelerador de IA contra NVIDIA. TPU8 compete com H100/H200 da NVIDIA para cargas de trabalho de treinamento de hiperscalers, embora adopção permaneça concentrada em implantações do Google Cloud.