Meta implementa decenas de millones de núcleos AWS Graviton5 para IA agentica a escala multimillonaria
Meta se comprometió a implementar decenas de millones de núcleos AWS Graviton5 en un acuerdo multimillonario, posicionando al gigante de redes sociales como uno de los mayores clientes de la infraestructura de CPU personalizada de Amazon. El acuerdo incluye la opción de expandir la capacidad a medida que crecen las cargas de trabajo de IA de Meta, señalando una validación empresarial importante para Graviton como plataforma de CPU para IA agentica.
Graviton5, lanzado en junio de 2026, empaqueta 192 núcleos por chip en el proceso 3nm de TSMC, con un caché L3 5 veces más grande, hasta 33% de latencia entre núcleos más baja, y memoria DDR5-8800. AWS posiciona el chip directamente en cargas de trabajo agenticas—razonamiento, generación de código en tiempo real y orquestación de tareas multietapa—donde la orquestración de CPU es el cuello de botella, no la utilización de GPU. Meta se unirá a Uber y Snowflake en la escala de Graviton para infraestructura de agentes.
Para los arquitectos, esto valida un cambio crítico de infraestructura: los sistemas de IA agentica son orquestadores limitados por CPU, no entrenadores limitados por GPU. La densidad de 192 núcleos y la latencia más baja de Graviton abordan directamente la sobrecarga de coordinación en entornos de agentes persistentes. Graviton ahora representa más del 50% de las nuevas adiciones de capacidad de CPU de AWS en los últimos tres años y ha superado una tasa de ejecución anual de $20 mil millones—infraestructura de nivel empresarial, no experimental.
Fuentes
- Primary source
- datacenterdynamics.com
“Meta has signed a deal with Amazon Web Services (AWS) to deploy "tens of millions" of Graviton5 cores in support of agentic AI workloads. The exact financial terms or timeline were not shared, but in response to a DCD request for comment, AWS said the agreement represented a "multibillion-dollar deal over several years."”
- aws.amazon.com
“With 192 cores, a 5x larger L3 cache, up to 33% lower inter-core latency, and DDR5 memory delivering high bandwidth, Graviton5 helps agents spend less time waiting on CPU-bound steps, processing more instructions, handling large numbers of concurrent environments, and keeping accelerators moving. Meta is deploying Graviton at scale starting with tens of millions of cores to support its agentic AI efforts, making Meta one of the largest Graviton customers in the world.”
- aboutamazon.com
“Graviton started as Amazon's Arm based cloud CPU experiment, but it has now become one of AWS's most important custom silicon projects. AWS now fields Graviton CPUs, Trainium AI accelerators, Inferentia inference processors, Nitro infrastructure offload chips, and custom networking silicon.”