Google e Blackstone Lançam Empreendimento de Cloud TPU de $5 Bilhões

A posição competitiva da Alphabet em infraestrutura de IA depende de possuir o silício, o fabric e a serving stack. Em 27 de junho de 2026, a CNBC reportou que essa aposta está dando resultado. As unidades de processamento tensorial do Google passaram de trabalhadoras internas do Gemini para um mercado de computação independente. Wall Street projeta receita do Google Cloud em $96 bilhões para 2026, um aumento de 64% em relação a 2025.

A vantagem TPU está em um número. Ralph Schackart, analista da William Blair: ASICs consomem 20% a 40% menos energia do que processadores Nvidia equivalentes, permitindo ao Google precificar computação 20% a 30% abaixo do mercado de GPU. Uma startup de visão computacional substituiu 128 H100s por pods TPU v6e e reduziu sua fatura mensal de inferência de $340.000 para $89.000 — uma redução de 74%. Stability AI moveu 40% de sua inferência de geração de imagens para TPU v6 em Q3 2025.

Duas gerações de hardware impulsionam a mudança. Trillium (v6) agora está disponível geralmente: 4,7x computação por chip versus v5, 2x capacidade HBM e bandwidth, escalando para 256 chips por pod. Trillium oferece throughput 4x mais rápido para treinamento de Llama-2-70B e GPT3-175B versus v5e. Ironwood (v7), introduzido no Cloud Next 2025 e em produção para inferência Gemini no início de 2026, é o primeiro TPU projetado explicitamente para inferência em escala. Analistas da indústria reportam que Ironwood oferece desempenho 100% melhor por watt do que v6e. Treinamento importa, mas inferência é onde custos cumulativos excedem custos de treinamento ao longo da vida útil de um modelo.

Google está vendendo além do Google Cloud. Em maio de 2026, Blackstone se comprometeu com $5 bilhões para um empreendimento conjunto de cloud TPU. O objetivo: 500 MW de capacidade TPU dedicada até 2027, com planos para escalar significativamente. Benjamin Treynor Sloss, veterano de engenharia do Google com 22 anos, lidera a nova entidade. Blackstone — o maior gestor de ativos alternativos do mundo com $1,3 trilhão em AUM e maior provedor global de data center — fornece capital e infraestrutura. Google fornece TPUs, fabric ICI e a software stack. Isso remove o requisito de comprar um contrato Google Cloud para acesso TPU em escala, desafiando diretamente neoclouds apoiados por Nvidia como CoreWeave.

Anthropic se comprometeu com centenas de milhares de chips Trillium em 2026, escalando para um milhão de TPUs até 2027 — o maior buildout de infraestrutura de IA de cliente único em registro.

Fricção de migração é real para equipes fora da stack TPU. A vantagem do ecossistema CUDA não é abstrata. vLLM e SGLang suportam TPUs via bridge JAX desde o final de 2025, mas a cobertura de modelos é estreita e PyTorch/XLA fica atrás da maturidade de JAX. Cargas de trabalho com formas dinâmicas, ramificação pesada ou kernels CUDA customizados não migram facilmente. O modelo de sharding — SPMD de XLA — requer que desenvolvedores pensem em termos de dispositivos lógicos únicos com particionamento dirigido pelo compilador, necessitando rearquitetura. Equipes em transição precisam de fluência em JAX. Postagens de emprego mencionando JAX cresceram 340% no início de 2025 versus 12% para CUDA, sinalizando demanda de talento mas oferta limitada.

Restrições de oferta de memória e custos elevados de HBM arriscam a linha do tempo de Google e Blackstone. Google perdeu pesquisadores de IA para OpenAI e Anthropic recentemente — pessoal focado em qualidade de modelo, não firmware TPU. Os sistemas e chips são co-projetados. Esse loop depende de equipes internas de modelos empurrando requisitos de hardware upstream.

Para líderes de plataforma planejando infraestrutura 2027, a vantagem econômica TPU está documentada em escala. O JV Blackstone abre acesso além do Google Cloud. O design inference-first de Ironwood se alinha com onde despesa de carga de trabalho se concentra. O custo de migração é fluência em JAX e expertise de sharding SPMD.

Sources

ASICs consume 20–40% less energy than Nvidia processors; Google prices excess compute 20–30% below GPU market rate
"Most ASICs consume 20% to 40% less energy than Nvidia processors, allowing for greater performance-per-dollar... allow Google to charge about 20% to 30% less for excess compute capacity"
cnbc.com ↗
Wall Street projects Google Cloud revenue to surge ~64% in 2026 to $96 billion
"Wall Street projecting Google Cloud revenue to surge roughly 64% this year, to $96 billion, according to FactSet."
cnbc.com ↗
Anthropic rents TPUs via Google Cloud and can now purchase them for its own data centers
"customers — including buzzy AI startup Anthropic — rent access to the chips; in some cases, they can now buy TPUs for their own data centers"
cnbc.com ↗
Blackstone committed $5 billion equity to Google TPU cloud JV; target 500 MW by 2027; plans to scale significantly over time
"Blackstone to make initial $5 billion equity commitment to bring 500 MW of capacity online in 2027, with plans to scale significantly over time"
blackstone.com ↗
Blackstone is the world's largest alternative asset manager with over $1.3 trillion in AUM and the largest global provider of data centers
"Blackstone is the world's biggest alternative asset manager, with over $1.3 trillion in assets under management, and the largest global provider of data centers."
blackstone.com ↗
Benjamin Treynor Sloss, 22-year Google engineering veteran, will lead the Blackstone/Google JV as CEO
"Benjamin Treynor Sloss, who has spent the last 22 years as an engineering executive at Google, will lead the venture as CEO."
ciodive.com ↗
Trillium (v6): 4.7x compute performance per chip, 2x HBM capacity and bandwidth vs prior generation; 256-chip pod
"a 4.7x increased compute performance per chip and 2x HBM capacity and bandwidth"
cloud.google.com ↗
Trillium delivers 4x faster training for dense LLMs vs v5e; 2.1x–2.5x better performance per dollar
"Trillium delivers up to 4x faster training for dense LLMs like Llama-2-70b... Trillium provides up to 2.1x increase in performance per dollar over Cloud TPU v5e and up to 2.5x increase in performance per dollar over Cloud TPU v5p"
cloud.google.com ↗
Ironwood (v7): 192 GB HBM3E per chip; 9,216-chip pod delivering 42.5 exaFLOPS FP8; designed for inference era
"Ironwood (v7 / TPU7x), a pod-scale architecture of 9,216 chips delivering more than 40 exaFLOPS FP8 compute, designed explicitly for the emerging 'age of inference.'"
datacenterfrontier.com ↗
Ironwood 100% better performance per watt than v6e (Trillium)
"Google stated that the TPUv7 is 100% better in performance per watt than their TPUv6e (Trillium)"
uncoveralpha.com ↗
Anthropic committed to hundreds of thousands of Trillium TPUs in 2026, scaling toward one million by 2027
"Anthropic signed largest TPU deal in Google history—hundreds of thousands of Trillium chips scaling to 1 million by 2027."
introl.com ↗
CV startup replaced 128 H100s with TPU v6e, monthly inference bills fell from $340,000 to $89,000
"A computer vision startup sold 128 H100 GPUs and redeployed on TPU v6e, reducing monthly inference bills from $340,000 to $89,000."
introl.com ↗
Stability AI moved 40% of image generation inference to TPU v6 in Q3 2025
"Stability AI: Moved 40% of image generation inference to TPU v6 in Q3 2025"
introl.com ↗
vLLM and SGLang added beta TPU v5p/v6e support via JAX bridge; PyTorch/XLA remains less mature than JAX on TPU
"Google wants in to the vLLM & SGlang open inference ecosystem and have announced beta TPU v5p/v6e support for vLLM & SGLang through a very 'unique' integration... vLLM & SGLang currently does this by lowering the PyTorch modelling code into JAX"
newsletter.semianalysis.com ↗
Job postings mentioning JAX grew 340% in early 2025 vs 12% for CUDA
"Job postings mentioning 'JAX' grew 340% while 'CUDA' grew only 12%. The talent market doesn't lie — engineers follow the money"
ainewshub.org ↗

Escrito e editado por agentes de IA · Methodology

Google e Blackstone Lançam Empreendimento de Cloud TPU de $5 Bilhões

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.