AO VIVO · QUA., 24 DE JUN. DE 2026 --:--:-- ET
Edição Nº 64 GASTO TOTAL $14510.26 ARTIGOS HOJE 14 TOKENS TOTAL 9.10B
aiexpert
Na linha
Market Micron publica receita Q3 de $41,5 bilhões, guia $50 bilhões para Q4 em superciclo de memória de IA Funding Qualcomm adquire Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA da NVIDIA Market AWS lança instâncias EC2 G7 com NVIDIA RTX PRO 4500 Blackwell; ganhos de 4.6x em inferência Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete com volumes de produção em 2028 Chips OpenAI revela chip Jalapeño para inferência com Broadcom, alvo de implantação no final de 2026 Breaking Huang diz aos acionistas que centros de dados do mercado negro de chips contrabandeados são um "beco sem saída" Research Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes Research Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura Market Micron Q3 bate ganho com márgens DRAM recordes; suprimento de HBM totalmente alocado até 2026 Policy EUA garantem Países Baixos para aliança de chip Pax Silica; tensões de ASML persistem sobre restrições de exportação MATCH Act Chips OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026 Breaking Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search Research IA projeta rapidamente chips de rádio-frequência novos além da intuição humana, reduzindo anos de trabalho para horas Chips Supercomputador LineShine da China lidera TOP500 com 2.198 exaflops apenas com CPU, encerrando reinado de El Capitan dos EUA Market Ações da Cerebras caem 17% após perda de orientação de margem, CEO diz que aviso foi 'mal compreendido' Market Sunrun, Tesla e Renew Home formam usina de energia virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi redesenhado, planejando lançamento de serviço pago em final de 2026 Funding XCures fecha rodada Series B de $46M com avaliação pós-money de $127M Funding Qualcomm adquire Modular por ~$4B para fortalecer stack de software de IA e negócio de data center Chips OpenAI & Broadcom revelam Jalapeño, chip de inferência LLM customizado com ciclo de design de 9 meses Market Micron publica receita Q3 de $41,5 bilhões, guia $50 bilhões para Q4 em superciclo de memória de IA Funding Qualcomm adquire Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA da NVIDIA Market AWS lança instâncias EC2 G7 com NVIDIA RTX PRO 4500 Blackwell; ganhos de 4.6x em inferência Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete com volumes de produção em 2028 Chips OpenAI revela chip Jalapeño para inferência com Broadcom, alvo de implantação no final de 2026 Breaking Huang diz aos acionistas que centros de dados do mercado negro de chips contrabandeados são um "beco sem saída" Research Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes Research Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura Market Micron Q3 bate ganho com márgens DRAM recordes; suprimento de HBM totalmente alocado até 2026 Policy EUA garantem Países Baixos para aliança de chip Pax Silica; tensões de ASML persistem sobre restrições de exportação MATCH Act Chips OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026 Breaking Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search Research IA projeta rapidamente chips de rádio-frequência novos além da intuição humana, reduzindo anos de trabalho para horas Chips Supercomputador LineShine da China lidera TOP500 com 2.198 exaflops apenas com CPU, encerrando reinado de El Capitan dos EUA Market Ações da Cerebras caem 17% após perda de orientação de margem, CEO diz que aviso foi 'mal compreendido' Market Sunrun, Tesla e Renew Home formam usina de energia virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi redesenhado, planejando lançamento de serviço pago em final de 2026 Funding XCures fecha rodada Series B de $46M com avaliação pós-money de $127M Funding Qualcomm adquire Modular por ~$4B para fortalecer stack de software de IA e negócio de data center Chips OpenAI & Broadcom revelam Jalapeño, chip de inferência LLM customizado com ciclo de design de 9 meses
Chips

OpenAI revela chip Jalapeño para inferência com Broadcom, alvo de implantação no final de 2026

OpenAI e Broadcom anunciaram nesta quarta-feira Jalapeño, o primeiro chip acelerador de IA customizado da OpenAI projetado especificamente para inferência de modelos de linguagem grande. As empresas afirmam que testes internos iniciais mostram desempenho por watt substancialmente melhor do que os sistemas estado da arte atual, embora benchmarks finais ainda não tenham sido liberados. O chip foi desenvolvido de design para tape-out em nove meses, um turnaround inusitadamente rápido que a OpenAI atribui ao uso de seus próprios modelos para acelerar partes do processo de design de hardware.

Jalapeño é um ASIC propositalmente construído com um chiplet de computação massivo (~840mm² die do tamanho do reticle) cercado por seis módulos de memória HBM e otimizado para inferência de baixa latência e alto throughput. Ao contrário de GPUs de propósito geral, a arquitetura é ajustada em torno dos padrões de serving de LLM, movimento de memória e eficiência de networking—equilibrando computação, memória e I/O para operar mais próximo da utilização máxima teórica. Broadcom cuida da fabricação de silício e contribui com seu silício de networking Tomahawk; Celestica fornece integração de rack e placa.

A implantação começa em escala de gigawatt no final de 2026 através da Microsoft e outros parceiros, com produção inicial de prototipagem no final de 2026 escalando nos anos seguintes. O presidente da OpenAI, Greg Brockman, disse ao CNBC que OpenAI não consegue computação rápido suficiente, ressaltando a pressão de infraestrutura que impulsiona a parceria. O CEO da Broadcom, Hock Tan, notou que a demanda de computação dos seis clientes hyperscaler da empresa é insaciável e esperado permanecer elevada até 2028.

Para arquitetos de IA, Jalapeño sinaliza o movimento da OpenAI de possuir a stack completa—de modelos a hardware de inferência—para reduzir custos e latência no serving. Isso importa porque OpenAI controla tanto a workload quanto o silício, permitindo co-otimização hardware-software mais ajustada do que GPUs de prateleira podem entregar. O ciclo de design de nove meses e os planos de escala gigawatt sugerem uma alternativa credível ao domínio da NVIDIA em infraestrutura de inferência, embora números de desempenho rigoroso ainda estejam pendentes.

Fontes