AWS lança instâncias EC2 G7 com NVIDIA RTX PRO 4500 Blackwell; ganhos de 4.6x em inferência
Amazon Web Services anunciou a disponibilidade geral das instâncias EC2 G7 alimentadas por GPUs NVIDIA RTX PRO 4500 Blackwell Server Edition em 18 de junho de 2026. G7 é o primeiro tipo de instância de nuvem pública a apresentar a GPU do servidor de geração Blackwell, entregando até 4.6x de desempenho de inferência de IA e até 2.1x de desempenho de gráficos em comparação com instâncias G6 de geração anterior. As instâncias suportam até 8 GPUs por nó com 32 GB de memória por GPU, totalizando 256 GB de memória de GPU, emparelhadas com processadores Intel Xeon Scaláveis customizados de 6ª geração, até 700 Gbps de rede EFA (7x versus G6) e até 7.6 TB de armazenamento NVMe SSD.
G7 vem em 7 tamanhos suportando até 192 vCPUs e é otimizado para cargas de trabalho de inferência de IA (tradução de linguagem, análise de vídeo/imagem, reconhecimento de fala, sistemas de recomendação), renderização de gráficos profissionais, VDI e análise acelerada por GPU no Amazon EMR. AWS alcançou status NVIDIA Exemplar Cloud em cargas de trabalho de treinamento NVIDIA GB300, confirmando que a infraestrutura AWS atende aos limites de desempenho de referência da NVIDIA. As instâncias G7 estão disponíveis em US East (Ohio) e US West (Oregon) com planos para expansão regional e podem ser adquiridas via opções On-Demand, Savings Plans e Spot.
O lançamento reflete a demanda de hiperscaler por capacidade escalada de GPU: G7 fornece indexação de vetor mais rápida (até 10x mais rápida a 1/4 do custo versus OpenSearch apenas CPU via NVIDIA cuVS), comunicação multi-GPU com latência mais baixa via GPUDirect P2P e RDMA, e a largura de banda de rede necessária para inferência distribuída. A combinação de computação Blackwell, memória de alta largura de banda (2.45x versus G6) e interconexão otimizada visa implantação de IA em escala de produção onde latência, throughput e custo por inferência impulsionam decisões de arquitetura.
Para arquitetos de nuvem implantando inferência em escala, G7 valida o cronograma Blackwell da Nvidia em mãos do cliente e sinaliza uma corrida aérter-se em custo por inferência: Jalapeño da OpenAI/Broadcom e Dragonfly da Qualcomm visam ganhos de eficiência semelhantes, mas a disponibilidade imediata de G7, escala AWS e maturidade Blackwell oferecem aos hiperscalers uma linha de base confiável. Monitore as curvas de adoção de G7 e ganhos de desempenho de busca vetorial como indicadores se GPUs de nuvem de propósito geral permanecem competitivas em custo por inferência com ASICs customizados para inferência de alto volume.