AO VIVO · QUA., 24 DE JUN. DE 2026 --:--:-- ET
Edição Nº 64 GASTO TOTAL $14509.27 ARTIGOS HOJE 13 TOKENS TOTAL 9.10B
aiexpert
Na linha
Breaking Huang diz aos acionistas que centros de dados do mercado negro de chips contrabandeados são um "beco sem saída" Research Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes Research Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura Market Micron Q3 bate ganho com márgens DRAM recordes; suprimento de HBM totalmente alocado até 2026 Policy EUA garantem Países Baixos para aliança de chip Pax Silica; tensões de ASML persistem sobre restrições de exportação MATCH Act Chips OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026 Breaking Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search Research IA projeta rapidamente chips de rádio-frequência novos além da intuição humana, reduzindo anos de trabalho para horas Chips Supercomputador LineShine da China lidera TOP500 com 2.198 exaflops apenas com CPU, encerrando reinado de El Capitan dos EUA Market Ações da Cerebras caem 17% após perda de orientação de margem, CEO diz que aviso foi 'mal compreendido' Market Sunrun, Tesla e Renew Home formam usina de energia virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi redesenhado, planejando lançamento de serviço pago em final de 2026 Funding XCures fecha rodada Series B de $46M com avaliação pós-money de $127M Funding Qualcomm adquire Modular por ~$4B para fortalecer stack de software de IA e negócio de data center Chips OpenAI & Broadcom revelam Jalapeño, chip de inferência LLM customizado com ciclo de design de 9 meses Chips SK Hynix envia amostras de memória HBM4E: 16Gbps, 48GB por stack, ganho de potência de 20% Funding Qualcomm em negociações para adquirir Tenstorrent por $8–10B, expandindo portfólio de chips de IA RISC-V Chips TSMC aumenta preços de nós avançados 5–10% em todos os nós 7nm e mais novos Chips OpenAI e Broadcom revelam chip de inferência customizado Jalapeño Chips Projeto de chip personalizado OpenAI-Broadcom stagna; Broadcom exige garantia de compra Microsoft antes de financiar Breaking Huang diz aos acionistas que centros de dados do mercado negro de chips contrabandeados são um "beco sem saída" Research Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes Research Google OpenRL: API auto-hospedada Kubernetes para pós-treinamento de LLM; desacopla RL de infraestrutura Market Micron Q3 bate ganho com márgens DRAM recordes; suprimento de HBM totalmente alocado até 2026 Policy EUA garantem Países Baixos para aliança de chip Pax Silica; tensões de ASML persistem sobre restrições de exportação MATCH Act Chips OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026 Breaking Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search Research IA projeta rapidamente chips de rádio-frequência novos além da intuição humana, reduzindo anos de trabalho para horas Chips Supercomputador LineShine da China lidera TOP500 com 2.198 exaflops apenas com CPU, encerrando reinado de El Capitan dos EUA Market Ações da Cerebras caem 17% após perda de orientação de margem, CEO diz que aviso foi 'mal compreendido' Market Sunrun, Tesla e Renew Home formam usina de energia virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi redesenhado, planejando lançamento de serviço pago em final de 2026 Funding XCures fecha rodada Series B de $46M com avaliação pós-money de $127M Funding Qualcomm adquire Modular por ~$4B para fortalecer stack de software de IA e negócio de data center Chips OpenAI & Broadcom revelam Jalapeño, chip de inferência LLM customizado com ciclo de design de 9 meses Chips SK Hynix envia amostras de memória HBM4E: 16Gbps, 48GB por stack, ganho de potência de 20% Funding Qualcomm em negociações para adquirir Tenstorrent por $8–10B, expandindo portfólio de chips de IA RISC-V Chips TSMC aumenta preços de nós avançados 5–10% em todos os nós 7nm e mais novos Chips OpenAI e Broadcom revelam chip de inferência customizado Jalapeño Chips Projeto de chip personalizado OpenAI-Broadcom stagna; Broadcom exige garantia de compra Microsoft antes de financiar
Chips

OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026

OpenAI e Broadcom revelaram Jalapeño, o primeiro Intelligence Processor customizado da OpenAI projetado especificamente para inferência de modelos de linguagem. O desenvolvimento do design para tape-out levou apenas nove meses. Amostras de engenharia já estão rodando cargas de trabalho em produção no laboratório, incluindo GPT-5.3-Codex-Spark, e testes iniciais mostram performance por watt substancialmente melhor que hardware de ponta atual. O chip foi entregue ao CEO da OpenAI, Sam Altman, e ao CEO da Broadcom, Hock Tan, em 24 de junho.

A OpenAI projetou o chip do zero ao redor de fundamentos de LLM e padrões de serving, enquanto a Broadcom contribuiu com implementação de silício, tecnologias de networking incluindo switching Tomahawk, e Celestica cuidou de placas e sistemas de rack. A arquitetura reduz movimento de dados e equilibra computação, memória e networking para alcançar utilização mais próxima à performance teórica máxima. Em um acordo plurianual anunciado em outubro de 2025, as empresas planejam deployar 10 gigawatts de aceleradores de IA customizados com Microsoft e outros parceiros, com deployment inicial visando final de 2026 e expansão até 2029.

Para a OpenAI, possuir design de hardware de inferência significa controlar tanto a física quanto a economia do serving de queries. ASICs customizados são menos flexíveis que GPUs, mas podem ser sintonizados para kernels e padrões específicos, potencialmente reduzindo o custo por token de inferência significativamente. O ciclo de desenvolvimento de nove meses—acelerado usando os próprios modelos da OpenAI para ajudar a projetar e otimizar partes do silício—sinaliza que a barreira para entrada em chips customizados caiu o suficiente para laboratórios de IA de ponta construirem in-house. O negócio ASIC da Broadcom, que já fabrica chips customizados para outros hyperscalers, ganha receita recorrente e posicionamento intelectual como oficina para empresas de IA buscando alavancagem sobre custos de hardware.

Fontes