AO VIVO · SEG., 29 DE JUN. DE 2026 --:--:-- ET
Edição Nº 69 GASTO TOTAL $14603.40 ARTIGOS HOJE 1 TOKENS TOTAL 9.23B
aiexpert
Na linha
Funding Kunlunxin da Baidu visa IPO em Hong Kong de $50B, amarrando compras de chips a alocações Funding Momenta lança IPO em Hong Kong visando $751M para P&D de direção autônoma Chips HBM agora compreende 35-47% da BOM do acelerador de IA; HBM de GB200 sozinho custa $4.800/unidade Market Receita HBM4 da Samsung ultrapassa $1 bilhão; visa taxa de execução de $10 bilhões até final de 2026 Chips OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026 Market TSMC avisa que escassez de chips de IA persistirá até 2027; sinaliza aumento de preço 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI Breaking OpenAI lança rede de parceiros de $150M para certificar 300K consultores até o final do ano Breaking HP se torna adotante principal do Frontier; OpenAI dimensiona plataforma de agente de IA corporativo com parcerias de consultoria Breaking Apple solicita à Casa Branca aprovaçãoparafornecer CXMT conforme os custos de memória atingem aumentos de 20% em MacBook e iPad Funding Samsung, SK Hynix planejam capex de $1,3T ao longo de uma década sob demanda de memória para IA Breaking Lenovo, NVIDIA Parceria em AI Cloud Gigafactory; Reduzem Timelines de Implementação de Servidor de Inferência de Meses para Semanas Chips TPUs do Google Alimentam Expansão da Anthropic; Até 1M de Chips Ironwood Trancam Deal de Capacidade Multi-Gigawatt de $40B Através de 2027+ Chips NVIDIA confirma produção em volume de Vera Rubin; GPU Rubin lidera AgentPerf com 20x eficiência sobre Hopper Policy FERC ordena aos operadores de rede para expeditar conexões de centros de dados de IA; prazo de 60 dias para justificar ou reescrever tarifas Chips Subvenção CHIPS da Coherent de $50M para expansão de fábrica de fosfeto de índio; quadruplica saída de wafer de Sherman para redes óticas de IA Chips NVIDIA parceira com SK Hynix em memória de IA de próxima geração; codesenvolvendo para Vera Rubin e fábricas autônomas Chips CoWoS da TSMC atinge 98% de rendimento; roteiro SoW-X suporta 64 pilhas HBM; produção de óptica co-empacotada 2026 Chips DDR5 PNY-5600 32GB atinge $379,99 — kit 2x16GB mais barato em meio a crise de RAM; desconto de 16% Chips Produção TSMC 2nm atinge 70% de rendimento; Apple, NVIDIA trancadas até 2026 Funding Kunlunxin da Baidu visa IPO em Hong Kong de $50B, amarrando compras de chips a alocações Funding Momenta lança IPO em Hong Kong visando $751M para P&D de direção autônoma Chips HBM agora compreende 35-47% da BOM do acelerador de IA; HBM de GB200 sozinho custa $4.800/unidade Market Receita HBM4 da Samsung ultrapassa $1 bilhão; visa taxa de execução de $10 bilhões até final de 2026 Chips OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026 Market TSMC avisa que escassez de chips de IA persistirá até 2027; sinaliza aumento de preço 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI Breaking OpenAI lança rede de parceiros de $150M para certificar 300K consultores até o final do ano Breaking HP se torna adotante principal do Frontier; OpenAI dimensiona plataforma de agente de IA corporativo com parcerias de consultoria Breaking Apple solicita à Casa Branca aprovaçãoparafornecer CXMT conforme os custos de memória atingem aumentos de 20% em MacBook e iPad Funding Samsung, SK Hynix planejam capex de $1,3T ao longo de uma década sob demanda de memória para IA Breaking Lenovo, NVIDIA Parceria em AI Cloud Gigafactory; Reduzem Timelines de Implementação de Servidor de Inferência de Meses para Semanas Chips TPUs do Google Alimentam Expansão da Anthropic; Até 1M de Chips Ironwood Trancam Deal de Capacidade Multi-Gigawatt de $40B Através de 2027+ Chips NVIDIA confirma produção em volume de Vera Rubin; GPU Rubin lidera AgentPerf com 20x eficiência sobre Hopper Policy FERC ordena aos operadores de rede para expeditar conexões de centros de dados de IA; prazo de 60 dias para justificar ou reescrever tarifas Chips Subvenção CHIPS da Coherent de $50M para expansão de fábrica de fosfeto de índio; quadruplica saída de wafer de Sherman para redes óticas de IA Chips NVIDIA parceira com SK Hynix em memória de IA de próxima geração; codesenvolvendo para Vera Rubin e fábricas autônomas Chips CoWoS da TSMC atinge 98% de rendimento; roteiro SoW-X suporta 64 pilhas HBM; produção de óptica co-empacotada 2026 Chips DDR5 PNY-5600 32GB atinge $379,99 — kit 2x16GB mais barato em meio a crise de RAM; desconto de 16% Chips Produção TSMC 2nm atinge 70% de rendimento; Apple, NVIDIA trancadas até 2026
Chips

NVIDIA confirma produção em volume de Vera Rubin; GPU Rubin lidera AgentPerf com 20x eficiência sobre Hopper

O CEO da NVIDIA Jensen Huang confirmou no GTC Taipei (Computex 2026 em 1º de junho) que a GPU Vera Rubin entrou em produção em volume, com disponibilidade de parceiros começando em H2 2026. A GPU Rubin apresenta 336 bilhões de transistores no TSMC N3, 288GB HBM4 (dobro da capacidade de Blackwell), 22 TB/s de largura de banda de memória, entregando 50 PFLOPS NVFP4 de inferência e 35 PFLOPS de treinamento por GPU.

A liderança de benchmark de Vera Rubin agora é tangencial: o rack Blackwell Ultra NVL72 da NVIDIA (72 GPUs) liderou AgentPerf, o primeiro benchmark de IA agenética da Artificial Analysis, executando 20x mais agentes por megawatt do que Hopper em configurações equivalentes. Esse ganho de eficiência sinaliza que Rubin—entregando 1.5x desempenho teórico por GPU sobre Blackwell Ultra—está posicionado para remodelar a economia de custo-por-inferência para serviços de IA em produção executando cargas de trabalho agenticas de longa duração.

A NVIDIA anunciou uma parceria de memória plurianual com SK hynix (7 de junho) para codesenvolver memória de próxima geração para plataformas Vera, abrangendo GPUs Rubin, CPUs Vera, PCs RTX Spark e Jetson Thor. SK hynix usará NVIDIA CUDA-X e PhysicsNeMo para simulação de semicondutores. Esse bloqueio no lado da oferta reflete a escassez de memória estrutural: hiperscalers não podem se dar ao luxo do risco de alocação spot.

Para compradores de infraestrutura e planejadores de capacidade, a disponibilidade de Vera Rubin em H2 2026 e liderança em AgentPerf implicam uma janela de transição de 12–18 meses para competir em custo de inferência. Hiperscalers com frotas Hopper existentes enfrentam a matemática de ROI de consolidar capital em direção a Rubin, enquanto provedores menores de serviços de IA devem avaliar se manter capacidade pré-Rubin até 2027 é viável diante da demanda de produção e custos crescentes de memória.

Fontes