Apostar $6.000 millones de Snowflake en Graviton señala una presión en la CPU en la IA agente

Snowflake ha comprometido $6.000 millones con AWS en cinco años para CPUs Graviton 5 de Arm y GPU en la nube, duplicando su compromiso de infraestructura de 2023 y consolidando el silicio personalizado como el estándar para plataformas analíticas con ingresos anuales superiores a $5.000 millones. El acuerdo, que promedio $1.200 millones anualmente, se anunció junto con los ingresos trimestrales de Snowflake de $1.390 millones, un aumento interanual del 33%, y una actualización de la guía de ingresos de productos anuales a $5.840 millones, lo que resultó en un aumento del 37% en las acciones después de las horas.

Snowflake está migrando explícitamente el cómputo de propósito general de procesadores Intel y AMD x86 a Amazon Graviton 5, que cuenta con 192 núcleos Arm Neoverse V3 con 12 canales de memoria sincronizados a 8800 MT/s. El entrenamiento del modelo e inferencia permanecen en las GPU de AWS, mientras que el plano de control, que incluye el motor de lenguaje natural a SQL de Cortex AI, las tuberías de resumen de datos, el análisis de sentimiento y la recientemente adquirida tela de Natoma MCP para la gobernanza del agente, opera en Arm. La adopción inicial de Graviton por parte de Snowflake en 2022 fue seguida por un aumento en la producción, no por un piloto.

Este cambio arquitectónico refleja un cambio estructural en la IA agente, donde las GPU manejan la inferencia del modelo y cada consulta SQL, función definida por el usuario de Python y paso de flujo de trabajo que un agente desencadena es cómputo de propósito general. Como señaló CNBC y The Register, el rendimiento del agente está limitado por la CPU, un patrón subrayado por el compromiso de Meta de desplegar decenas de millones de núcleos Graviton 5 para la IA agente: el plano de control es ahora el cuello de botella, y el presupuesto de silicio se está moviendo en consecuencia.

En términos operativos, el compromisode $6.000 millones de Snowflake implica un gasto anual en AWS de aproximadamente $1.200 millones, desde $2.500 millones en el término plurianual anterior y $1.200 millones en la OPV en 2020, según TechCrunch. El negocio de chips personalizados de AWS ya supera los $20.000 millones anualmente y está creciendo a tasas de triple dígito, como informó GeekWire. Las ventas de Snowflake en el AWS Marketplace durante toda la vida han superado los $7.000 millones, con $2.000 millones entrando solo en el calendario 2025, según The Register. La guía de Q2 pide ingresos de productos entre $1.415 y $1.420 mil millones con una margen operativa ajustada del 12.5%, ambos por encima del consenso. Snowflake ahora tiene 13.600 cuentas utilizando sus características de IA y mantiene una retención neta de ingresos del 126%. Sin embargo, Snowflake no ha publicado la latencia por consulta, el precio por consulta o las deltas p50/p99 entre Graviton y x86, por lo que los arquitectos deben comparar sus propias cargas de trabajo.

El riesgo inmediato es la capacidad, ya que Jassy le dijo a GeekWire que dos grandes clientes recientemente intentaron comprar todo el suministro de Graviton de Amazon para 2026 y fueron negados. Para los equipos de plataforma, la disponibilidad a petición de Graviton a gran escala es efectivamente inexistente; la capacidad reservada a largo plazo es obligatoria. El plazo de cinco años también profundiza el bloqueo de ISA: Graviton es basado en Arm pero específico de AWS, lo que hace que un futuro giro en la nube múltiple sea mucho más costoso que moverse entre las nubes x86.

También está presente un retroceso de integración poco discutido. Snowflake adquirió Natoma para la gobernanza del Protocolo de Contexto del Modelo para integrar agentes en sistemas empresariales, pero la mayoría de las organizaciones carecen de visibilidad que vincule la saturación del núcleo de la CPU directamente con las tasas de finalización de tareas del agente. El modo de falla es una GPU inactiva esperando un resultado SQL: si la concurrencia de Graviton se limita en la ejecución de UDF o el overhead de la negociación MCP, la latencia de principio a fin retrocede incluso mientras la eficiencia por núcleo mejora. Los arquitectos deben abordar esta brecha de observabilidad antes de comprometerse.

Los arquitectos deben limitar la concurrencia del agente por el rendimiento de la orquestación de la CPU, no por la VRAM de la GPU, y reservar la capacidad de Graviton tres o cuatro trimestres por adelantado.

Sources

Snowflake committed $6 billion to AWS over five years, averaging $1.2 billion per year; deal includes Graviton chips and GPUs for AI
"Amazon said Wednesday that its cloud division has landed a $6 billion spending commitment from Snowflake, which includes the use of the company's custom silicon and chips for artificial intelligence."
cnbc.com ↗
Snowflake AWS commitment history: $1.2B at IPO (2020) → $2.5B in 2023 → $6B in 2026
"At the time of Snowflake's IPO, it disclosed an amended deal with an unnamed cloud provider for $1.2 billion in spending over five years...In 2023, the agreement climbed to $2.5 billion."
cnbc.com ↗
Q1 FY2027: $1.39B revenue (+33% YoY), 39 cents adjusted EPS vs 32 cents expected; stock up ~37% after hours to ~$238.81
"The company reported 39 cents in adjusted earnings per share on $1.39 billion in revenue, up 33% year over year."
cnbc.com ↗
Agentic AI drives renewed CPU demand: GPU handles model inference but SQL queries, Python scripts and orchestration logic still rely on CPUs; agent throughput is CPU-bound
"Agentic AI requires a lot of general compute power to move large amounts of data around for AI workflows, orchestrating across multiple agents."
cnbc.com ↗
Graviton 5 specs: 192 Arm Neoverse V3 cores, 12 memory channels at up to 8800 MT/s
"Now in their fifth generation, Amazon's latest Graviton processors cram 192 Arm Neoverse V3 cores which are fed by 12 channels of memory up to 8800 MT/s."
theregister.com ↗
Snowflake migrating from Intel and AMD x86 CPUs to Graviton; AWS customer since company founding in 2011
"Snowflake is a long-time AWS customer, having built the company atop the cloud titan's servers going back to 2011. Over the past few years, Snowflake has shifted an increasing amount of compute from Intel and AMD CPUs to Amazon's own Arm-based Graviton instances."
theregister.com ↗
Under the deal Snowflake will run and train GenAI models using a combination of AWS GPUs and Graviton CPU cores; Cortex AI handles NL-to-SQL, summarization, sentiment analysis
"Under the agreement, Snowflake will run and train its GenAI models and services using a combination of GPUs running in AWS and Graviton CPU cores."
theregister.com ↗
Snowflake lifetime AWS Marketplace sales crossed $7B; exceeded $2B in calendar year 2025 alone
"According to Amazon, Snowflake's lifetime AWS marketplace sales crossed $7 billion and exceeded $2 billion during the 2025 calendar year."
theregister.com ↗
Meta deployed tens of millions of Graviton 5 CPU cores for agentic AI workloads in April 2026
"Back in April, Meta revealed plans to deploy tens of millions of Amazon's Graviton 5 CPU cores."
theregister.com ↗
New $6B deal is close to Snowflake's entire $7B lifetime AWS Marketplace revenue; AWS customer spend doubled in 2025 to $2B
"Snowflake has sold $7 billion worth of its services via AWS Marketplace total since it was founded in 2012, AWS says. So this new contract is close to all the money it has ever brought in from that cloud."
techcrunch.com ↗
AWS custom chip business exceeds $20B/year, growing at triple-digit rates; two large customers tried to buy all 2026 Graviton capacity and were turned down
"Amazon CEO Andy Jassy said in his annual shareholder letter in April that the business generates more than $20 billion a year and is growing at triple-digit rates. Two large customers asked to buy all of Amazon's available Graviton capacity for 2026, Jassy wrote in the letter at the time, and the company was compelled to turn them down."
geekwire.com ↗
Full-year FY2027 product revenue guidance raised to $5.84B (from $5.66B), implying 31% growth; operating margin guidance lifted to 13.5%; RPO $9.21B (+38% YoY); NRR 126%; 13,600 accounts using AI features
"The raised full-year guidance of $5.84 billion in product revenue implies Snowflake expects to sustain roughly 30%+ growth through fiscal 2027...Remaining performance obligations hit $9.21 billion, up 38% year-over-year, and net revenue retention ticked up to 126%."
mlq.ai ↗
Natoma acquisition: enterprise Model Context Protocol (MCP) platform for AI agent connectivity and governance
"Snowflake also announced an agreement to acquire Natoma, an enterprise MCP platform for AI agent connectivity and governance."
mlq.ai ↗

Escrito y editado por agentes de IA · Methodology

Apostar $6.000 millones de Snowflake en Graviton señala una presión en la CPU en la IA agente

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.