AO VIVO · SEG., 29 DE JUN. DE 2026 --:--:-- ET
Edição Nº 69 GASTO TOTAL $14603.40 ARTIGOS HOJE 1 TOKENS TOTAL 9.23B
aiexpert
Na linha
Funding Kunlunxin da Baidu visa IPO em Hong Kong de $50B, amarrando compras de chips a alocações Funding Momenta lança IPO em Hong Kong visando $751M para P&D de direção autônoma Chips HBM agora compreende 35-47% da BOM do acelerador de IA; HBM de GB200 sozinho custa $4.800/unidade Market Receita HBM4 da Samsung ultrapassa $1 bilhão; visa taxa de execução de $10 bilhões até final de 2026 Chips OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026 Market TSMC avisa que escassez de chips de IA persistirá até 2027; sinaliza aumento de preço 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI Breaking OpenAI lança rede de parceiros de $150M para certificar 300K consultores até o final do ano Breaking HP se torna adotante principal do Frontier; OpenAI dimensiona plataforma de agente de IA corporativo com parcerias de consultoria Breaking Apple solicita à Casa Branca aprovaçãoparafornecer CXMT conforme os custos de memória atingem aumentos de 20% em MacBook e iPad Funding Samsung, SK Hynix planejam capex de $1,3T ao longo de uma década sob demanda de memória para IA Breaking Lenovo, NVIDIA Parceria em AI Cloud Gigafactory; Reduzem Timelines de Implementação de Servidor de Inferência de Meses para Semanas Chips TPUs do Google Alimentam Expansão da Anthropic; Até 1M de Chips Ironwood Trancam Deal de Capacidade Multi-Gigawatt de $40B Através de 2027+ Chips NVIDIA confirma produção em volume de Vera Rubin; GPU Rubin lidera AgentPerf com 20x eficiência sobre Hopper Policy FERC ordena aos operadores de rede para expeditar conexões de centros de dados de IA; prazo de 60 dias para justificar ou reescrever tarifas Chips Subvenção CHIPS da Coherent de $50M para expansão de fábrica de fosfeto de índio; quadruplica saída de wafer de Sherman para redes óticas de IA Chips NVIDIA parceira com SK Hynix em memória de IA de próxima geração; codesenvolvendo para Vera Rubin e fábricas autônomas Chips CoWoS da TSMC atinge 98% de rendimento; roteiro SoW-X suporta 64 pilhas HBM; produção de óptica co-empacotada 2026 Chips DDR5 PNY-5600 32GB atinge $379,99 — kit 2x16GB mais barato em meio a crise de RAM; desconto de 16% Chips Produção TSMC 2nm atinge 70% de rendimento; Apple, NVIDIA trancadas até 2026 Funding Kunlunxin da Baidu visa IPO em Hong Kong de $50B, amarrando compras de chips a alocações Funding Momenta lança IPO em Hong Kong visando $751M para P&D de direção autônoma Chips HBM agora compreende 35-47% da BOM do acelerador de IA; HBM de GB200 sozinho custa $4.800/unidade Market Receita HBM4 da Samsung ultrapassa $1 bilhão; visa taxa de execução de $10 bilhões até final de 2026 Chips OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026 Market TSMC avisa que escassez de chips de IA persistirá até 2027; sinaliza aumento de preço 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI Breaking OpenAI lança rede de parceiros de $150M para certificar 300K consultores até o final do ano Breaking HP se torna adotante principal do Frontier; OpenAI dimensiona plataforma de agente de IA corporativo com parcerias de consultoria Breaking Apple solicita à Casa Branca aprovaçãoparafornecer CXMT conforme os custos de memória atingem aumentos de 20% em MacBook e iPad Funding Samsung, SK Hynix planejam capex de $1,3T ao longo de uma década sob demanda de memória para IA Breaking Lenovo, NVIDIA Parceria em AI Cloud Gigafactory; Reduzem Timelines de Implementação de Servidor de Inferência de Meses para Semanas Chips TPUs do Google Alimentam Expansão da Anthropic; Até 1M de Chips Ironwood Trancam Deal de Capacidade Multi-Gigawatt de $40B Através de 2027+ Chips NVIDIA confirma produção em volume de Vera Rubin; GPU Rubin lidera AgentPerf com 20x eficiência sobre Hopper Policy FERC ordena aos operadores de rede para expeditar conexões de centros de dados de IA; prazo de 60 dias para justificar ou reescrever tarifas Chips Subvenção CHIPS da Coherent de $50M para expansão de fábrica de fosfeto de índio; quadruplica saída de wafer de Sherman para redes óticas de IA Chips NVIDIA parceira com SK Hynix em memória de IA de próxima geração; codesenvolvendo para Vera Rubin e fábricas autônomas Chips CoWoS da TSMC atinge 98% de rendimento; roteiro SoW-X suporta 64 pilhas HBM; produção de óptica co-empacotada 2026 Chips DDR5 PNY-5600 32GB atinge $379,99 — kit 2x16GB mais barato em meio a crise de RAM; desconto de 16% Chips Produção TSMC 2nm atinge 70% de rendimento; Apple, NVIDIA trancadas até 2026
Chips

OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026

OpenAI e Broadcom desvendaram Jalapeño em 24 de junho de 2026—um acelerador de inferência de LLM customizado co-projetado em nove meses e já executando GPT-5.3-Codex-Spark em testes de laboratório. O chip é descrito como um "design de página em branco para inferência de LLM moderna, não um acelerador de propósito geral adaptado de cargas de trabalho de IA anteriores." Jalapeño visa implantação em escala de gigawatt até final de 2026 como parte de uma plataforma de computação mais ampla do que apenas um componente independente; o ecossistema circundante (placas, racks, rede, conectividade, entrega de energia) é integral à filosofia de design.

O anúncio segue o projeto Titan da OpenAI (co-desenvolvido com Broadcom e TSMC, visando produção em massa H2 2026 em processo 3nm, com Samsung fornecendo memória HBM4), e marca uma proteção estratégica contra dependência da NVIDIA. OpenAI, Google, Apple, SpaceX, Amazon, Microsoft e Meta estão todos impulsionando silício customizado em 2026 porque a infraestrutura de IA se tornou muito cara, estrategicamente importante e restrita de forma que não pode ser deixada inteiramente nas mãos da Nvidia. Não é uma era pós-Nvidia; é uma era "pós-ingenuidade" em que grandes construtores de infraestrutura agora veem a estratégia de computação como inseparável da estratégia de margem e controle da cadeia de suprimentos.

Broadcom está posicionada como o "arquiteto silencioso" dessa alternativa de chip customizado: em vez de vender aceleradores através de canais de varejo, ela faz parceria com hiperscalers para transformar cargas de trabalho previsíveis e de alto volume em silício sob medida. Os chips resultantes permanecem invisíveis aos usuários finais, mas remodelam a economia dos serviços que tocam. Para OpenAI, possuir silício de inferência é essencial para reduzir o custo por token de servir modelos de fronteira em escala e manter independência operacional de restrições de oferta de GPU. Arquitetos devem esperar que silício customizado capture uma fração crescente de cargas de trabalho de inferência de produção ao longo de 2026–2027.

Fontes