AO VIVO · SEG., 29 DE JUN. DE 2026 --:--:-- ET
Edição Nº 69 GASTO TOTAL $14606.44 ARTIGOS HOJE 3 TOKENS TOTAL 9.24B
aiexpert
Na linha
Chips Samsung envia amostras de HBM4E líderes da indústria a 16Gbps, 48GB por stack; ganho de velocidade de 20%+ sobre HBM4 Market Micron guia $50 bi Q4, margens de 86%; assina 16 acordos de clientes estratégicos no valor de ~$100 bi Chips Acelerador de inferência d-Matrix Corsair entra em produção total; afirma 10x mais rápido decodificar que apenas GPU com 5x menos energia Market SoftBank se compromete com €75 bilhões para construir 5 GW de capacidade de data center de IA na França até 2031 Funding Governo do Reino Unido apoia iniciativa de capital de risco de £400 milhões para gestores de fundos diversificados Chips Plataforma NVIDIA Blackwell chega; GPUs B200/B300 com velocidade de inferência 4x mais rápida que H100, custo/energia 25x menores Breaking HP implanta Frontier do OpenAI em operações empresariais; junta-se a seis adotadores da plataforma inaugural Market 79% da capacidade global de data centers de IA enfrenta risco elevado de hazards climáticos; operadores se deslocam para zonas rurais e de clima extremo Funding Kunlunxin da Baidu visa IPO em Hong Kong de $50B, amarrando compras de chips a alocações Funding Momenta lança IPO em Hong Kong visando $751M para P&D de direção autônoma Chips HBM agora compreende 35-47% da BOM do acelerador de IA; HBM de GB200 sozinho custa $4.800/unidade Market Receita HBM4 da Samsung ultrapassa $1 bilhão; visa taxa de execução de $10 bilhões até final de 2026 Chips OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026 Market TSMC avisa que escassez de chips de IA persistirá até 2027; sinaliza aumento de preço 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI Breaking OpenAI lança rede de parceiros de $150M para certificar 300K consultores até o final do ano Breaking HP se torna adotante principal do Frontier; OpenAI dimensiona plataforma de agente de IA corporativo com parcerias de consultoria Breaking Apple solicita à Casa Branca aprovaçãoparafornecer CXMT conforme os custos de memória atingem aumentos de 20% em MacBook e iPad Funding Samsung, SK Hynix planejam capex de $1,3T ao longo de uma década sob demanda de memória para IA Breaking Lenovo, NVIDIA Parceria em AI Cloud Gigafactory; Reduzem Timelines de Implementação de Servidor de Inferência de Meses para Semanas Chips Samsung envia amostras de HBM4E líderes da indústria a 16Gbps, 48GB por stack; ganho de velocidade de 20%+ sobre HBM4 Market Micron guia $50 bi Q4, margens de 86%; assina 16 acordos de clientes estratégicos no valor de ~$100 bi Chips Acelerador de inferência d-Matrix Corsair entra em produção total; afirma 10x mais rápido decodificar que apenas GPU com 5x menos energia Market SoftBank se compromete com €75 bilhões para construir 5 GW de capacidade de data center de IA na França até 2031 Funding Governo do Reino Unido apoia iniciativa de capital de risco de £400 milhões para gestores de fundos diversificados Chips Plataforma NVIDIA Blackwell chega; GPUs B200/B300 com velocidade de inferência 4x mais rápida que H100, custo/energia 25x menores Breaking HP implanta Frontier do OpenAI em operações empresariais; junta-se a seis adotadores da plataforma inaugural Market 79% da capacidade global de data centers de IA enfrenta risco elevado de hazards climáticos; operadores se deslocam para zonas rurais e de clima extremo Funding Kunlunxin da Baidu visa IPO em Hong Kong de $50B, amarrando compras de chips a alocações Funding Momenta lança IPO em Hong Kong visando $751M para P&D de direção autônoma Chips HBM agora compreende 35-47% da BOM do acelerador de IA; HBM de GB200 sozinho custa $4.800/unidade Market Receita HBM4 da Samsung ultrapassa $1 bilhão; visa taxa de execução de $10 bilhões até final de 2026 Chips OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026 Market TSMC avisa que escassez de chips de IA persistirá até 2027; sinaliza aumento de preço 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodifica de especulação reduz latência de inferência 85%, atinge Together AI Breaking OpenAI lança rede de parceiros de $150M para certificar 300K consultores até o final do ano Breaking HP se torna adotante principal do Frontier; OpenAI dimensiona plataforma de agente de IA corporativo com parcerias de consultoria Breaking Apple solicita à Casa Branca aprovaçãoparafornecer CXMT conforme os custos de memória atingem aumentos de 20% em MacBook e iPad Funding Samsung, SK Hynix planejam capex de $1,3T ao longo de uma década sob demanda de memória para IA Breaking Lenovo, NVIDIA Parceria em AI Cloud Gigafactory; Reduzem Timelines de Implementação de Servidor de Inferência de Meses para Semanas
Chips

Acelerador de inferência d-Matrix Corsair entra em produção total; afirma 10x mais rápido decodificar que apenas GPU com 5x menos energia

d-Matrix anunciou que sua plataforma acelerador de inferência Corsair entrou em produção total em 9 de junho, com envios em volume começando para hiperscalers prioritários, neoclouds e laboratórios de IA de fronteira. O acelerador de chiplet baseado em SRAM, fabricado no processo N6 da TSMC via Alchip Technologies, é projetado especificamente para a fase de decodificação de cargas de inferência em clusters de computação hetero gêneos emparelhados com GPUs. A empresa cita testes independentes do Gimlet Labs mostrando que configurações Corsair + GPU emparelhadas reduzem tempos de resposta de inferência de aproximadamente 24 segundos para menos de dois segundos, aproximadamente 10x aceleração versus abordagens apenas com GPU.

Corsair contorna o muro de memória integrando computação rigidamente com SRAM on-chip, evitando restrições de oferta de DRAM e memória de banda larga alta (HBM) que afligem arquiteturas concorrentes. Cada cartão PCIe empacota 4 GB de Memória de Desempenho com largura de banda de 300 TB/s, atingindo computação de pico de 4.800 TFLOPs para MXINT8 e 19.200 TFLOPs para MXINT4. d-Matrix posiciona Corsair como complementar a GPUs em vez de um substituto, visando aplicações de IA agentic sensativas à latência incluindo Claude Code, agentes de voz e assistentes de codificação interativa que exigem geração rápida de tokens.

O tempo se alinha com a demanda crescente por arquiteturas de inferência disagregadas conforme cargas de trabalho agentic empurram infraestrutura apenas com GPU aos seus limites. d-Matrix garantiu serviços plurianuais de oferta e fabricação; a empresa também adquiriu o negócio de data center da GigaIO em abril, trazendo expertise de sistemas em escala de rack que culmina em SquadRack, um design de referência pronto para produção construido com Arista, Broadcom e Supermicro. O braço de risco M12 da Microsoft e Temasek são investidores; a startup levantou $275 milhões em Série C.

Para equipes de infraestrutura, o Corsair entrando em produção em volume marca uma mudança na economia de inferência: clusters hetero gêneos dividindo prefill para GPUs e decodificar para aceleradores especializados agora têm uma alternativa validada em produção, com oferta previsível de N6 e arquitetura SRAM. Os operadores agora têm um ponto de diferenciação tático ao evitar gargalos de alocação de HBM em deslocamentos de inferência restritos por latência.

Fontes