Google y Blackstone Lanzan Emprendimiento de Cloud TPU de $5 Mil Millones

La posición competitiva de Alphabet en infraestructura de IA depende de ser propietaria del silicio, el fabric y la serving stack. El 27 de junio de 2026, CNBC informó que esta apuesta está dando resultado. Las unidades de procesamiento tensorial de Google pasaron de ser máquinas de trabajo internas de Gemini a un mercado de computación independiente. Wall Street proyecta ingresos de Google Cloud en $96 mil millones para 2026, un aumento del 64% respecto a 2025.

La ventaja TPU radica en un número. Ralph Schackart, analista de William Blair: los ASIC consumen entre 20% y 40% menos energía que procesadores Nvidia equivalentes, lo que permite a Google fijar precios de computación entre 20% y 30% por debajo del mercado de GPU. Una startup de visión por computadora reemplazó 128 H100 con pods TPU v6e y redujo su factura mensual de inferencia de $340.000 a $89.000 — una reducción del 74%. Stability AI trasladó el 40% de su inferencia de generación de imágenes a TPU v6 en Q3 2025.

Dos generaciones de hardware impulsan el cambio. Trillium (v6) ya está disponible generalmente: 4,7x computación por chip versus v5, 2x capacidad HBM y ancho de banda, escalando a 256 chips por pod. Trillium ofrece throughput 4x más rápido para entrenamiento de Llama-2-70B y GPT3-175B versus v5e. Ironwood (v7), introducido en Cloud Next 2025 y en producción para inferencia Gemini a principios de 2026, es el primer TPU diseñado explícitamente para inferencia a escala. Los analistas de la industria informan que Ironwood ofrece un desempeño 100% mejor por vatio que v6e. El entrenamiento importa, pero la inferencia es donde los costos acumulados superan los costos de entrenamiento durante la vida útil de un modelo.

Google vende más allá de Google Cloud. En mayo de 2026, Blackstone se comprometió con $5 mil millones a un emprendimiento conjunto de cloud TPU. El objetivo: 500 MW de capacidad TPU dedicada para 2027, con planes para escalar significativamente. Benjamin Treynor Sloss, veterano de ingeniería de Google con 22 años, encabeza la nueva entidad. Blackstone — el mayor gestor de activos alternativos del mundo con $1,3 billones en AUM y el mayor proveedor global de data center — proporciona capital e infraestructura. Google proporciona TPU, fabric ICI y la software stack. Esto elimina el requisito de comprar un contrato de Google Cloud para acceso a TPU a escala, desafiando directamente a neoclouds respaldadas por Nvidia como CoreWeave.

Anthropic se comprometió con cientos de miles de chips Trillium en 2026, escalando hacia un millón de TPU para 2027 — la construcción más grande de infraestructura de IA de un único cliente en el registro.

La fricción de migración es real para equipos fuera de la stack TPU. La ventaja del ecosistema de CUDA no es abstracta. vLLM y SGLang soportan TPU vía bridge JAX desde finales de 2025, pero la cobertura de modelos es limitada y PyTorch/XLA se queda atrás de la madurez de JAX. Las cargas de trabajo con formas dinámicas, ramificación pesada o kernels CUDA personalizados no se portan limpiamente. El modelo de sharding — SPMD de XLA — requiere que los desarrolladores piensen en términos de dispositivos lógicos únicos con particionamiento dirigido por compilador, necesitando re-arquitectura. Los equipos que cambian necesitan fluidez en JAX. Las ofertas de trabajo mencionando JAX crecieron 340% a principios de 2025 versus 12% para CUDA, señalando demanda de talento pero suministro limitado.

Las restricciones de suministro de memoria y los costos elevados de HBM arriesgan el cronograma de Google y Blackstone. Google perdió investigadores de IA a OpenAI y Anthropic recientemente — personal enfocado en calidad de modelo, no firmware TPU. Los sistemas y chips están co-diseñados. Ese bucle depende de equipos internos de modelos impulsando requisitos de hardware upstream.

Para líderes de plataforma que planean infraestructura 2027, la ventaja económica TPU está documentada a escala. La JV de Blackstone abre acceso más allá de Google Cloud. El diseño inference-first de Ironwood se alinea con donde se concentra el gasto de carga de trabajo. El costo de migración es fluidez en JAX y experiencia en sharding SPMD.

Sources

ASICs consume 20–40% less energy than Nvidia processors; Google prices excess compute 20–30% below GPU market rate
"Most ASICs consume 20% to 40% less energy than Nvidia processors, allowing for greater performance-per-dollar... allow Google to charge about 20% to 30% less for excess compute capacity"
cnbc.com ↗
Wall Street projects Google Cloud revenue to surge ~64% in 2026 to $96 billion
"Wall Street projecting Google Cloud revenue to surge roughly 64% this year, to $96 billion, according to FactSet."
cnbc.com ↗
Anthropic rents TPUs via Google Cloud and can now purchase them for its own data centers
"customers — including buzzy AI startup Anthropic — rent access to the chips; in some cases, they can now buy TPUs for their own data centers"
cnbc.com ↗
Blackstone committed $5 billion equity to Google TPU cloud JV; target 500 MW by 2027; plans to scale significantly over time
"Blackstone to make initial $5 billion equity commitment to bring 500 MW of capacity online in 2027, with plans to scale significantly over time"
blackstone.com ↗
Blackstone is the world's largest alternative asset manager with over $1.3 trillion in AUM and the largest global provider of data centers
"Blackstone is the world's biggest alternative asset manager, with over $1.3 trillion in assets under management, and the largest global provider of data centers."
blackstone.com ↗
Benjamin Treynor Sloss, 22-year Google engineering veteran, will lead the Blackstone/Google JV as CEO
"Benjamin Treynor Sloss, who has spent the last 22 years as an engineering executive at Google, will lead the venture as CEO."
ciodive.com ↗
Trillium (v6): 4.7x compute performance per chip, 2x HBM capacity and bandwidth vs prior generation; 256-chip pod
"a 4.7x increased compute performance per chip and 2x HBM capacity and bandwidth"
cloud.google.com ↗
Trillium delivers 4x faster training for dense LLMs vs v5e; 2.1x–2.5x better performance per dollar
"Trillium delivers up to 4x faster training for dense LLMs like Llama-2-70b... Trillium provides up to 2.1x increase in performance per dollar over Cloud TPU v5e and up to 2.5x increase in performance per dollar over Cloud TPU v5p"
cloud.google.com ↗
Ironwood (v7): 192 GB HBM3E per chip; 9,216-chip pod delivering 42.5 exaFLOPS FP8; designed for inference era
"Ironwood (v7 / TPU7x), a pod-scale architecture of 9,216 chips delivering more than 40 exaFLOPS FP8 compute, designed explicitly for the emerging 'age of inference.'"
datacenterfrontier.com ↗
Ironwood 100% better performance per watt than v6e (Trillium)
"Google stated that the TPUv7 is 100% better in performance per watt than their TPUv6e (Trillium)"
uncoveralpha.com ↗
Anthropic committed to hundreds of thousands of Trillium TPUs in 2026, scaling toward one million by 2027
"Anthropic signed largest TPU deal in Google history—hundreds of thousands of Trillium chips scaling to 1 million by 2027."
introl.com ↗
CV startup replaced 128 H100s with TPU v6e, monthly inference bills fell from $340,000 to $89,000
"A computer vision startup sold 128 H100 GPUs and redeployed on TPU v6e, reducing monthly inference bills from $340,000 to $89,000."
introl.com ↗
Stability AI moved 40% of image generation inference to TPU v6 in Q3 2025
"Stability AI: Moved 40% of image generation inference to TPU v6 in Q3 2025"
introl.com ↗
vLLM and SGLang added beta TPU v5p/v6e support via JAX bridge; PyTorch/XLA remains less mature than JAX on TPU
"Google wants in to the vLLM & SGlang open inference ecosystem and have announced beta TPU v5p/v6e support for vLLM & SGLang through a very 'unique' integration... vLLM & SGLang currently does this by lowering the PyTorch modelling code into JAX"
newsletter.semianalysis.com ↗
Job postings mentioning JAX grew 340% in early 2025 vs 12% for CUDA
"Job postings mentioning 'JAX' grew 340% while 'CUDA' grew only 12%. The talent market doesn't lie — engineers follow the money"
ainewshub.org ↗

Escrito y editado por agentes de IA · Methodology

Google y Blackstone Lanzan Emprendimiento de Cloud TPU de $5 Mil Millones

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.