AWS lanza instancias EC2 G7 con NVIDIA RTX PRO 4500 Blackwell; ganancias de inferencia de 4.6x
Amazon Web Services anunció la disponibilidad general de instancias EC2 G7 alimentadas por GPUs NVIDIA RTX PRO 4500 Blackwell Server Edition el 18 de junio de 2026. G7 es el primer tipo de instancia de nube pública en presentar la GPU del servidor de la generación Blackwell, ofreciendo hasta 4.6x de rendimiento de inferencia de IA y hasta 2.1x de rendimiento de gráficos en comparación con instancias G6 de generación anterior. Las instancias admiten hasta 8 GPU por nodo con 32 GB de memoria por GPU, para un total de 256 GB de memoria de GPU, emparejadas con procesadores Intel Xeon Scalable de 6ª generación personalizados, hasta 700 Gbps de redes EFA (7x versus G6) y hasta 7.6 TB de almacenamiento NVMe SSD.
G7 viene en 7 tamaños que admiten hasta 192 vCPU y está optimizado para cargas de trabajo de inferencia de IA (traducción de idiomas, análisis de video/imagen, reconocimiento de voz, sistemas de recomendación), renderizado de gráficos profesionales, VDI y análisis acelerado por GPU en Amazon EMR. AWS logró el estado NVIDIA Exemplar Cloud en cargas de trabajo de entrenamiento NVIDIA GB300, confirmando que la infraestructura AWS cumple con los umbrales de desempeño de referencia de NVIDIA. Las instancias G7 están disponibles en US East (Ohio) y US West (Oregon) con planes para expansión regional y se pueden comprar a través de opciones On-Demand, Savings Plans y Spot.
El lanzamiento refleja la demanda de hiperscaler de capacidad GPU escalada: G7 proporciona indexación de vectores más rápida (hasta 10x más rápida a 1/4 del costo versus OpenSearch solo CPU a través de NVIDIA cuVS), comunicación multi-GPU de baja latencia a través de GPUDirect P2P y RDMA, y el ancho de banda de red requerido para inferencia distribuida. La combinación de computación Blackwell, memoria de ancho de banda alto (2.45x versus G6) e interconexiones optimizadas apunta a la implementación de IA a escala de producción donde la latencia, el rendimiento y el costo por inferencia impulsan las decisiones arquitectónicas.
Para arquitectos en la nube que implementan inferencia a escala, G7 valida el cronograma Blackwell de Nvidia en manos del cliente y señala una carrera ajustada en costo por inferencia: Jalapeño de OpenAI/Broadcom y Dragonfly de Qualcomm apuntan a ganancias de eficiencia similares, pero la disponibilidad inmediata de G7, la escala de AWS y la madurez de Blackwell ofrecen a los hiperscalers una línea de base confiable. Monitoree las curvas de adopción de G7 y las ganancias de desempeño de búsqueda de vectores como indicadores de si las GPU en la nube de propósito general permanecen competitivas en costo por inferencia con ASIC personalizados para inferencia de alto volumen.