AO VIVO · SEG., 29 DE JUN. DE 2026 --:--:-- ET
Edição Nº 69 GASTO TOTAL $14605.54 ARTIGOS HOJE 2 TOKENS TOTAL 9.23B
aiexpert
Na linha
Chips Acelerador de inferência d-Matrix Corsair entra em produção total; afirma 10x mais rápido decodificar que apenas GPU com 5x menos energia Market SoftBank se compromete com €75 bilhões para construir 5 GW de capacidade de data center de IA na França até 2031 Funding Governo do Reino Unido apoia iniciativa de capital de risco de £400 milhões para gestores de fundos diversificados Chips Plataforma NVIDIA Blackwell chega; GPUs B200/B300 com velocidade de inferência 4x mais rápida que H100, custo/energia 25x menores Breaking HP implanta Frontier do OpenAI em operações empresariais; junta-se a seis adotadores da plataforma inaugural Market 79% da capacidade global de data centers de IA enfrenta risco elevado de hazards climáticos; operadores se deslocam para zonas rurais e de clima extremo Funding Kunlunxin da Baidu visa IPO em Hong Kong de $50B, amarrando compras de chips a alocações Funding Momenta lança IPO em Hong Kong visando $751M para P&D de direção autônoma Chips HBM agora compreende 35-47% da BOM do acelerador de IA; HBM de GB200 sozinho custa $4.800/unidade Market Receita HBM4 da Samsung ultrapassa $1 bilhão; visa taxa de execução de $10 bilhões até final de 2026 Chips OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026 Market TSMC avisa que escassez de chips de IA persistirá até 2027; sinaliza aumento de preço 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI Breaking OpenAI lança rede de parceiros de $150M para certificar 300K consultores até o final do ano Breaking HP se torna adotante principal do Frontier; OpenAI dimensiona plataforma de agente de IA corporativo com parcerias de consultoria Breaking Apple solicita à Casa Branca aprovaçãoparafornecer CXMT conforme os custos de memória atingem aumentos de 20% em MacBook e iPad Funding Samsung, SK Hynix planejam capex de $1,3T ao longo de uma década sob demanda de memória para IA Breaking Lenovo, NVIDIA Parceria em AI Cloud Gigafactory; Reduzem Timelines de Implementação de Servidor de Inferência de Meses para Semanas Chips TPUs do Google Alimentam Expansão da Anthropic; Até 1M de Chips Ironwood Trancam Deal de Capacidade Multi-Gigawatt de $40B Através de 2027+ Chips NVIDIA confirma produção em volume de Vera Rubin; GPU Rubin lidera AgentPerf com 20x eficiência sobre Hopper Chips Acelerador de inferência d-Matrix Corsair entra em produção total; afirma 10x mais rápido decodificar que apenas GPU com 5x menos energia Market SoftBank se compromete com €75 bilhões para construir 5 GW de capacidade de data center de IA na França até 2031 Funding Governo do Reino Unido apoia iniciativa de capital de risco de £400 milhões para gestores de fundos diversificados Chips Plataforma NVIDIA Blackwell chega; GPUs B200/B300 com velocidade de inferência 4x mais rápida que H100, custo/energia 25x menores Breaking HP implanta Frontier do OpenAI em operações empresariais; junta-se a seis adotadores da plataforma inaugural Market 79% da capacidade global de data centers de IA enfrenta risco elevado de hazards climáticos; operadores se deslocam para zonas rurais e de clima extremo Funding Kunlunxin da Baidu visa IPO em Hong Kong de $50B, amarrando compras de chips a alocações Funding Momenta lança IPO em Hong Kong visando $751M para P&D de direção autônoma Chips HBM agora compreende 35-47% da BOM do acelerador de IA; HBM de GB200 sozinho custa $4.800/unidade Market Receita HBM4 da Samsung ultrapassa $1 bilhão; visa taxa de execução de $10 bilhões até final de 2026 Chips OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026 Market TSMC avisa que escassez de chips de IA persistirá até 2027; sinaliza aumento de preço 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI Breaking OpenAI lança rede de parceiros de $150M para certificar 300K consultores até o final do ano Breaking HP se torna adotante principal do Frontier; OpenAI dimensiona plataforma de agente de IA corporativo com parcerias de consultoria Breaking Apple solicita à Casa Branca aprovaçãoparafornecer CXMT conforme os custos de memória atingem aumentos de 20% em MacBook e iPad Funding Samsung, SK Hynix planejam capex de $1,3T ao longo de uma década sob demanda de memória para IA Breaking Lenovo, NVIDIA Parceria em AI Cloud Gigafactory; Reduzem Timelines de Implementação de Servidor de Inferência de Meses para Semanas Chips TPUs do Google Alimentam Expansão da Anthropic; Até 1M de Chips Ironwood Trancam Deal de Capacidade Multi-Gigawatt de $40B Através de 2027+ Chips NVIDIA confirma produção em volume de Vera Rubin; GPU Rubin lidera AgentPerf com 20x eficiência sobre Hopper
Chips

Plataforma NVIDIA Blackwell chega; GPUs B200/B300 com velocidade de inferência 4x mais rápida que H100, custo/energia 25x menores

NVIDIA anunciou a plataforma Blackwell em 11 de junho de 2026 no GTC, marcando a chegada de sua arquitetura de GPU de próxima geração projetada para alimentar IA gerativa em tempo real em escala. O portfólio Blackwell inclui GPUs B200 (192GB HBM3e, 8 TB/s de largura de banda, suporte nativo a FP4) e B300 Blackwell Ultra (288GB HBM3e), oferecendo inferência LLM até 4 vezes mais rápida do que NVIDIA H100 e consumo de custo e energia 25 vezes menor em comparação com seu antecessor Hopper.

A oferta principal é o Superchip GB200 Grace Blackwell, emparelhando dois GPUs B200 com CPUs NVIDIA Grace sobre NVLink 900GB/s, e o sistema rack GB300 NVL72 com 72 GPUs Blackwell Ultra e 36 CPUs Grace otimizados para escalonamento de tempo de teste e IA agência de raciocínio. NVIDIA também anunciou projeto DIGITS, um supercomputador de IA pessoal com o Superchip GB10 Grace Blackwell, trazendo desempenho de IA em escala petaflop para desenvolvedores individuais para prototipagem e ajuste fino.

A adoção inicial é ampla: Amazon Web Services, Google, Microsoft, Meta, OpenAI, Oracle, Tesla e xAI estão entre os primeiros clientes. Parceiros de OEM, incluindo Cisco, Dell, HPE, Lenovo e Supermicro, estão enviando variantes de workstation e servidor RTX PRO Blackwell. Provedores de nuvem devem começar a oferecer instâncias Blackwell dentro do trimestre, embora restrições de alocação provavelmente persistam até H2 2026.

Para arquitetos: Blackwell representa a primeira mudança de plataforma completa de Hopper—não apenas GPU, mas CPU integrada (Grace), rede (Quantum-X800 em 800Gb/s) e software (microserviços de inferência NVIDIA NIM, TensorRT-LLM, novo framework de serviço de inferência Dynamo para escalonamento de tempo de teste). Orçamento do planejamento de infraestrutura assumindo ciclo de 1 ano: NVIDIA anunciou que Rubin (próxima geração) chegará em 2027, e a empresa formalizou ciclos de lansação de GPU anuais, mudando de ciclo de dois anos. Memória e potência permanecem restrições; comece conversás de procurement agora para H2 2026 e além.

Fontes