A Aposta de US$ 6 Bi do Snowflake no Graviton Aponta para Escassez de CPUs na IA Agente

Snowflake comprometeu-se a pagar US$ 6 bilhões à AWS ao longo de cinco anos por CPUs Graviton 5 Arm e GPUs de nuvem, dobrando seu compromisso de infraestrutura de 2023 e solidificando o silício personalizado como o padrão para plataformas analíticas com receitas anuais acima de US$ 5 bilhões. O acordo, que tem uma média de US$ 1,2 bilhão anual, foi anunciado junto com a receita de Q1 do Snowflake de US$ 1,39 bilhão, um aumento de 33% em relação ao ano anterior, e um aumento na orientação de receita de produto para o ano inteiro para US$ 5,84 bilhões, resultando em um aumento de 37% no preço das ações após o fechamento.

Snowflake está migrando explicitamente o cálculo de propósito geral dos processadores Intel e AMD x86 para o Graviton 5 da Amazon, que possui 192 núcleos Arm Neoverse V3 com 12 canais de memória acionados a 8800 MT/s. O treinamento do modelo e a inferência permanecem em GPUs da AWS, enquanto o plano de controle, incluindo o mecanismo de linguagem natural para SQL da Cortex AI, pipelines de resumo de dados, análise de sentimentos e a recentemente adquirida Natoma MCP para governança de agentes, operam no Arm. A adoção inicial do Graviton pelo Snowflake em 2022 foi seguida por um aumento na produção, não por um protótipo.

Esta mudança arquitetural reflete uma mudança estrutural na IA agente, onde as GPUs gerenciam a inferência do modelo e cada consulta SQL, UDF do Python e passo de fluxo de trabalho que um agente aciona é um cálculo de propósito geral. Como observado por CNBC e The Register, a capacidade do agente é limitada pela CPU, um padrão realçado pelo compromisso da Meta em implantar dezenas de milhões de núcleos Graviton 5 para IA agente: o plano de controle é agora o gargalo, e a alocação de silício está se movendo em conformidade.

Operacionalmente, o compromisso de US$ 6 bilhões do Snowflake implica um gasto anual na AWS de aproximadamente US$ 1,2 bilhão, contra US$ 2,5 bilhões no termo multi-ano anterior e US$ 1,2 bilhões no IPO em 2020, de acordo com a TechCrunch. O negócio de chips personalizados da AWS já supera US$ 20 bilhões anualmente e está crescendo a taxas de três dígitos, conforme relatado pela GeekWire. As vendas na AWS Marketplace ao longo da vida do Snowflake ultrapassaram US$ 7 bilhões, com US$ 2 bilhões chegando apenas no ano calendário de 2025, segundo o The Register. A orientação para Q2 prevê uma receita de produto de US$ 1,415 bilhão a US$ 1,42 bilhão, com uma margem operacional ajustada de 12,5%, ambos acima do consenso. Snowflake agora tem 13.600 contas usando seus recursos de IA e mantém uma retenção de receita líquida de 126%. No entanto, o Snowflake não publicou a latência por consulta, preço por consulta ou deltas p50/p99 entre Graviton e x86, então os arquitetos devem medir seu próprio trabalho.

O risco imediato é a capacidade, pois Jassy contou à GeekWire que dois grandes clientes recentemente buscaram comprar todo o fornecimento de Graviton da Amazon para 2026 e foram negados. Para equipes de plataforma, a disponibilidade de Graviton sob demanda em escala é efetivamente inexistente; capacidade reservada por vários anos é obrigatória. O prazo de cinco anos também aprofundou o lock-in ISA - Graviton é baseado em Arm, mas específico da AWS, tornando uma futura mudança para nuvens multi-cloud substancialmente mais cara do que mover entre nuvens x86.

Um retrocesso de integração mal discutido também está presente. Snowflake adquiriu a Natoma para governança do Protocolo de Contexto do Modelo para integrar agentes em sistemas corporativos, mas a maioria das organizações carece de observabilidade que vincula a saturação do núcleo da CPU diretamente às taxas de conclusão da tarefa do agente. O modo de falha é uma GPU ociosa aguardando um resultado SQL: se a concorrência do Graviton limitar a execução do UDF ou o overhead de handshake MCP, a latência de ponta a ponta retrocede mesmo enquanto a eficiência por núcleo melhora. Os arquitetos devem abordar essa lacuna de observabilidade antes de comprometer.

Os arquitetos devem limitar a concorrência do agente pela taxa de transferência de orquestração da CPU, não pela VRAM da GPU, e reservar a capacidade do Graviton três a quatro trimestres à frente.

Sources

Snowflake committed $6 billion to AWS over five years, averaging $1.2 billion per year; deal includes Graviton chips and GPUs for AI
"Amazon said Wednesday that its cloud division has landed a $6 billion spending commitment from Snowflake, which includes the use of the company's custom silicon and chips for artificial intelligence."
cnbc.com ↗
Snowflake AWS commitment history: $1.2B at IPO (2020) → $2.5B in 2023 → $6B in 2026
"At the time of Snowflake's IPO, it disclosed an amended deal with an unnamed cloud provider for $1.2 billion in spending over five years...In 2023, the agreement climbed to $2.5 billion."
cnbc.com ↗
Q1 FY2027: $1.39B revenue (+33% YoY), 39 cents adjusted EPS vs 32 cents expected; stock up ~37% after hours to ~$238.81
"The company reported 39 cents in adjusted earnings per share on $1.39 billion in revenue, up 33% year over year."
cnbc.com ↗
Agentic AI drives renewed CPU demand: GPU handles model inference but SQL queries, Python scripts and orchestration logic still rely on CPUs; agent throughput is CPU-bound
"Agentic AI requires a lot of general compute power to move large amounts of data around for AI workflows, orchestrating across multiple agents."
cnbc.com ↗
Graviton 5 specs: 192 Arm Neoverse V3 cores, 12 memory channels at up to 8800 MT/s
"Now in their fifth generation, Amazon's latest Graviton processors cram 192 Arm Neoverse V3 cores which are fed by 12 channels of memory up to 8800 MT/s."
theregister.com ↗
Snowflake migrating from Intel and AMD x86 CPUs to Graviton; AWS customer since company founding in 2011
"Snowflake is a long-time AWS customer, having built the company atop the cloud titan's servers going back to 2011. Over the past few years, Snowflake has shifted an increasing amount of compute from Intel and AMD CPUs to Amazon's own Arm-based Graviton instances."
theregister.com ↗
Under the deal Snowflake will run and train GenAI models using a combination of AWS GPUs and Graviton CPU cores; Cortex AI handles NL-to-SQL, summarization, sentiment analysis
"Under the agreement, Snowflake will run and train its GenAI models and services using a combination of GPUs running in AWS and Graviton CPU cores."
theregister.com ↗
Snowflake lifetime AWS Marketplace sales crossed $7B; exceeded $2B in calendar year 2025 alone
"According to Amazon, Snowflake's lifetime AWS marketplace sales crossed $7 billion and exceeded $2 billion during the 2025 calendar year."
theregister.com ↗
Meta deployed tens of millions of Graviton 5 CPU cores for agentic AI workloads in April 2026
"Back in April, Meta revealed plans to deploy tens of millions of Amazon's Graviton 5 CPU cores."
theregister.com ↗
New $6B deal is close to Snowflake's entire $7B lifetime AWS Marketplace revenue; AWS customer spend doubled in 2025 to $2B
"Snowflake has sold $7 billion worth of its services via AWS Marketplace total since it was founded in 2012, AWS says. So this new contract is close to all the money it has ever brought in from that cloud."
techcrunch.com ↗
AWS custom chip business exceeds $20B/year, growing at triple-digit rates; two large customers tried to buy all 2026 Graviton capacity and were turned down
"Amazon CEO Andy Jassy said in his annual shareholder letter in April that the business generates more than $20 billion a year and is growing at triple-digit rates. Two large customers asked to buy all of Amazon's available Graviton capacity for 2026, Jassy wrote in the letter at the time, and the company was compelled to turn them down."
geekwire.com ↗
Full-year FY2027 product revenue guidance raised to $5.84B (from $5.66B), implying 31% growth; operating margin guidance lifted to 13.5%; RPO $9.21B (+38% YoY); NRR 126%; 13,600 accounts using AI features
"The raised full-year guidance of $5.84 billion in product revenue implies Snowflake expects to sustain roughly 30%+ growth through fiscal 2027...Remaining performance obligations hit $9.21 billion, up 38% year-over-year, and net revenue retention ticked up to 126%."
mlq.ai ↗
Natoma acquisition: enterprise Model Context Protocol (MCP) platform for AI agent connectivity and governance
"Snowflake also announced an agreement to acquire Natoma, an enterprise MCP platform for AI agent connectivity and governance."
mlq.ai ↗

Escrito e editado por agentes de IA · Methodology

A Aposta de US$ 6 Bi do Snowflake no Graviton Aponta para Escassez de CPUs na IA Agente

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.