AO VIVO · QUA., 24 DE JUN. DE 2026 --:--:-- ET
Edição Nº 64 GASTO TOTAL $14510.26 ARTIGOS HOJE 14 TOKENS TOTAL 9.10B
aiexpert
Na linha
Market Micron publica receita Q3 de $41,5 bilhões, guia $50 bilhões para Q4 em superciclo de memória de IA Funding Qualcomm adquire Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA da NVIDIA Market AWS lança instâncias EC2 G7 com NVIDIA RTX PRO 4500 Blackwell; ganhos de 4.6x em inferência Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete com volumes de produção em 2028 Chips OpenAI revela chip Jalapeño para inferência com Broadcom, alvo de implantação no final de 2026 Breaking Huang diz aos acionistas que centros de dados do mercado negro de chips contrabandeados são um "beco sem saída" Research Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes Research Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura Market Micron Q3 bate ganho com márgens DRAM recordes; suprimento de HBM totalmente alocado até 2026 Policy EUA garantem Países Baixos para aliança de chip Pax Silica; tensões de ASML persistem sobre restrições de exportação MATCH Act Chips OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026 Breaking Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search Research IA projeta rapidamente chips de rádio-frequência novos além da intuição humana, reduzindo anos de trabalho para horas Chips Supercomputador LineShine da China lidera TOP500 com 2.198 exaflops apenas com CPU, encerrando reinado de El Capitan dos EUA Market Ações da Cerebras caem 17% após perda de orientação de margem, CEO diz que aviso foi 'mal compreendido' Market Sunrun, Tesla e Renew Home formam usina de energia virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi redesenhado, planejando lançamento de serviço pago em final de 2026 Funding XCures fecha rodada Series B de $46M com avaliação pós-money de $127M Funding Qualcomm adquire Modular por ~$4B para fortalecer stack de software de IA e negócio de data center Chips OpenAI & Broadcom revelam Jalapeño, chip de inferência LLM customizado com ciclo de design de 9 meses Market Micron publica receita Q3 de $41,5 bilhões, guia $50 bilhões para Q4 em superciclo de memória de IA Funding Qualcomm adquire Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA da NVIDIA Market AWS lança instâncias EC2 G7 com NVIDIA RTX PRO 4500 Blackwell; ganhos de 4.6x em inferência Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete com volumes de produção em 2028 Chips OpenAI revela chip Jalapeño para inferência com Broadcom, alvo de implantação no final de 2026 Breaking Huang diz aos acionistas que centros de dados do mercado negro de chips contrabandeados são um "beco sem saída" Research Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes Research Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura Market Micron Q3 bate ganho com márgens DRAM recordes; suprimento de HBM totalmente alocado até 2026 Policy EUA garantem Países Baixos para aliança de chip Pax Silica; tensões de ASML persistem sobre restrições de exportação MATCH Act Chips OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026 Breaking Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search Research IA projeta rapidamente chips de rádio-frequência novos além da intuição humana, reduzindo anos de trabalho para horas Chips Supercomputador LineShine da China lidera TOP500 com 2.198 exaflops apenas com CPU, encerrando reinado de El Capitan dos EUA Market Ações da Cerebras caem 17% após perda de orientação de margem, CEO diz que aviso foi 'mal compreendido' Market Sunrun, Tesla e Renew Home formam usina de energia virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi redesenhado, planejando lançamento de serviço pago em final de 2026 Funding XCures fecha rodada Series B de $46M com avaliação pós-money de $127M Funding Qualcomm adquire Modular por ~$4B para fortalecer stack de software de IA e negócio de data center Chips OpenAI & Broadcom revelam Jalapeño, chip de inferência LLM customizado com ciclo de design de 9 meses
Market

AWS lança instâncias EC2 G7 com NVIDIA RTX PRO 4500 Blackwell; ganhos de 4.6x em inferência

Amazon Web Services anunciou a disponibilidade geral das instâncias EC2 G7 alimentadas por GPUs NVIDIA RTX PRO 4500 Blackwell Server Edition em 18 de junho de 2026. G7 é o primeiro tipo de instância de nuvem pública a apresentar a GPU do servidor de geração Blackwell, entregando até 4.6x de desempenho de inferência de IA e até 2.1x de desempenho de gráficos em comparação com instâncias G6 de geração anterior. As instâncias suportam até 8 GPUs por nó com 32 GB de memória por GPU, totalizando 256 GB de memória de GPU, emparelhadas com processadores Intel Xeon Scaláveis customizados de 6ª geração, até 700 Gbps de rede EFA (7x versus G6) e até 7.6 TB de armazenamento NVMe SSD.

G7 vem em 7 tamanhos suportando até 192 vCPUs e é otimizado para cargas de trabalho de inferência de IA (tradução de linguagem, análise de vídeo/imagem, reconhecimento de fala, sistemas de recomendação), renderização de gráficos profissionais, VDI e análise acelerada por GPU no Amazon EMR. AWS alcançou status NVIDIA Exemplar Cloud em cargas de trabalho de treinamento NVIDIA GB300, confirmando que a infraestrutura AWS atende aos limites de desempenho de referência da NVIDIA. As instâncias G7 estão disponíveis em US East (Ohio) e US West (Oregon) com planos para expansão regional e podem ser adquiridas via opções On-Demand, Savings Plans e Spot.

O lançamento reflete a demanda de hiperscaler por capacidade escalada de GPU: G7 fornece indexação de vetor mais rápida (até 10x mais rápida a 1/4 do custo versus OpenSearch apenas CPU via NVIDIA cuVS), comunicação multi-GPU com latência mais baixa via GPUDirect P2P e RDMA, e a largura de banda de rede necessária para inferência distribuída. A combinação de computação Blackwell, memória de alta largura de banda (2.45x versus G6) e interconexão otimizada visa implantação de IA em escala de produção onde latência, throughput e custo por inferência impulsionam decisões de arquitetura.

Para arquitetos de nuvem implantando inferência em escala, G7 valida o cronograma Blackwell da Nvidia em mãos do cliente e sinaliza uma corrida aérter-se em custo por inferência: Jalapeño da OpenAI/Broadcom e Dragonfly da Qualcomm visam ganhos de eficiência semelhantes, mas a disponibilidade imediata de G7, escala AWS e maturidade Blackwell oferecem aos hiperscalers uma linha de base confiável. Monitore as curvas de adoção de G7 e ganhos de desempenho de busca vetorial como indicadores se GPUs de nuvem de propósito geral permanecem competitivas em custo por inferência com ASICs customizados para inferência de alto volume.

Fontes