AO VIVO · SEG., 29 DE JUN. DE 2026 --:--:-- ET
Edição Nº 69 GASTO TOTAL $14603.40 ARTIGOS HOJE 1 TOKENS TOTAL 9.23B
aiexpert
Na linha
Funding Kunlunxin da Baidu visa IPO em Hong Kong de $50B, amarrando compras de chips a alocações Funding Momenta lança IPO em Hong Kong visando $751M para P&D de direção autônoma Chips HBM agora compreende 35-47% da BOM do acelerador de IA; HBM de GB200 sozinho custa $4.800/unidade Market Receita HBM4 da Samsung ultrapassa $1 bilhão; visa taxa de execução de $10 bilhões até final de 2026 Chips OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026 Market TSMC avisa que escassez de chips de IA persistirá até 2027; sinaliza aumento de preço 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI Breaking OpenAI lança rede de parceiros de $150M para certificar 300K consultores até o final do ano Breaking HP se torna adotante principal do Frontier; OpenAI dimensiona plataforma de agente de IA corporativo com parcerias de consultoria Breaking Apple solicita à Casa Branca aprovaçãoparafornecer CXMT conforme os custos de memória atingem aumentos de 20% em MacBook e iPad Funding Samsung, SK Hynix planejam capex de $1,3T ao longo de uma década sob demanda de memória para IA Breaking Lenovo, NVIDIA Parceria em AI Cloud Gigafactory; Reduzem Timelines de Implementação de Servidor de Inferência de Meses para Semanas Chips TPUs do Google Alimentam Expansão da Anthropic; Até 1M de Chips Ironwood Trancam Deal de Capacidade Multi-Gigawatt de $40B Através de 2027+ Chips NVIDIA confirma produção em volume de Vera Rubin; GPU Rubin lidera AgentPerf com 20x eficiência sobre Hopper Policy FERC ordena aos operadores de rede para expeditar conexões de centros de dados de IA; prazo de 60 dias para justificar ou reescrever tarifas Chips Subvenção CHIPS da Coherent de $50M para expansão de fábrica de fosfeto de índio; quadruplica saída de wafer de Sherman para redes óticas de IA Chips NVIDIA parceira com SK Hynix em memória de IA de próxima geração; codesenvolvendo para Vera Rubin e fábricas autônomas Chips CoWoS da TSMC atinge 98% de rendimento; roteiro SoW-X suporta 64 pilhas HBM; produção de óptica co-empacotada 2026 Chips DDR5 PNY-5600 32GB atinge $379,99 — kit 2x16GB mais barato em meio a crise de RAM; desconto de 16% Chips Produção TSMC 2nm atinge 70% de rendimento; Apple, NVIDIA trancadas até 2026 Funding Kunlunxin da Baidu visa IPO em Hong Kong de $50B, amarrando compras de chips a alocações Funding Momenta lança IPO em Hong Kong visando $751M para P&D de direção autônoma Chips HBM agora compreende 35-47% da BOM do acelerador de IA; HBM de GB200 sozinho custa $4.800/unidade Market Receita HBM4 da Samsung ultrapassa $1 bilhão; visa taxa de execução de $10 bilhões até final de 2026 Chips OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026 Market TSMC avisa que escassez de chips de IA persistirá até 2027; sinaliza aumento de preço 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI Breaking OpenAI lança rede de parceiros de $150M para certificar 300K consultores até o final do ano Breaking HP se torna adotante principal do Frontier; OpenAI dimensiona plataforma de agente de IA corporativo com parcerias de consultoria Breaking Apple solicita à Casa Branca aprovaçãoparafornecer CXMT conforme os custos de memória atingem aumentos de 20% em MacBook e iPad Funding Samsung, SK Hynix planejam capex de $1,3T ao longo de uma década sob demanda de memória para IA Breaking Lenovo, NVIDIA Parceria em AI Cloud Gigafactory; Reduzem Timelines de Implementação de Servidor de Inferência de Meses para Semanas Chips TPUs do Google Alimentam Expansão da Anthropic; Até 1M de Chips Ironwood Trancam Deal de Capacidade Multi-Gigawatt de $40B Através de 2027+ Chips NVIDIA confirma produção em volume de Vera Rubin; GPU Rubin lidera AgentPerf com 20x eficiência sobre Hopper Policy FERC ordena aos operadores de rede para expeditar conexões de centros de dados de IA; prazo de 60 dias para justificar ou reescrever tarifas Chips Subvenção CHIPS da Coherent de $50M para expansão de fábrica de fosfeto de índio; quadruplica saída de wafer de Sherman para redes óticas de IA Chips NVIDIA parceira com SK Hynix em memória de IA de próxima geração; codesenvolvendo para Vera Rubin e fábricas autônomas Chips CoWoS da TSMC atinge 98% de rendimento; roteiro SoW-X suporta 64 pilhas HBM; produção de óptica co-empacotada 2026 Chips DDR5 PNY-5600 32GB atinge $379,99 — kit 2x16GB mais barato em meio a crise de RAM; desconto de 16% Chips Produção TSMC 2nm atinge 70% de rendimento; Apple, NVIDIA trancadas até 2026
Chips

TPUs do Google Alimentam Expansão da Anthropic; Até 1M de Chips Ironwood Trancam Deal de Capacidade Multi-Gigawatt de $40B Através de 2027+

O contrato com Anthropic cobre 5 gigawatts de capacidade de TPU e vale até $40 bilhões, marcando o maior compromisso comercial do Google de seu silício customizado para um único cliente externo. A expansão fornecerá à Anthropic múltiplos gigawatts de capacidade de TPU, esperados para entrar em operação a partir de 2027, via serviços Google Cloud bem como acesso a TPUs construídos pelo Google fornecidos através da Broadcom.

Cada chip Ironwood entrega 4.614 TFLOPs de compute FP8 com 192 GB de memória HBM3e e 7,4 TB/s de largura de banda de memória, com Google alegando uma melhoria de desempenho de pico 10x em relação a TPU v5p. O volume sinaliza a convicção do Google de que silício customizado, não apenas clusters de GPU alugados, definirá a economia de inferência de IA em escala. Semianalysis argumenta que Google é o mais novo e ameaçador desafiante de silício merchant da Nvidia, observando que Anthropic vai implementar TPUs em suas próprias instalações, posicionando Google para competir diretamente com Nvidia.

Para arquitetos de infraestrutura avaliando aquisição de acelerador de IA, os contratos de capacidade de TPU do Google representam uma alternativa viável de custo/desempenho a GPUs da NVIDIA para cargas de trabalho com uso intensivo de inferência. Treinar grandes modelos de linguagem em TPUs pode ser 40–60% mais barato que cargas de trabalho GPU equivalentes, de acordo com estimativas do próprio Google Cloud, embora o abastecimento agora esteja comprometido através de parceiros principais através de 2027–2028.

Fontes