OpenAI & Broadcom revelam Jalapeño, chip de inferência LLM customizado com ciclo de design de 9 meses
OpenAI e Broadcom revelaram Jalapeño na quarta-feira, o primeiro acelerador de IA customizado da OpenAI, co-desenvolvido em apenas nove meses da concepção ao tape-out de fabricação. O "Processador de Inteligência" foi arquitetado do zero ao redor de cargas de trabalho de inferência LLM, otimizado para reduzir movimento de dados e balancear computação, memória e rede para alcançar utilização mais próxima do desempenho teórico máximo. Testes iniciais em laboratório mostram Jalapeño entregando significativamente melhor desempenho por watt do que estado-da-arte atual e economias de custo ao redor de 50% comparado a GPUs típicos, de acordo com CEO Hock Tan da Broadcom.
O processo de design aproveitou desenvolvimento profundo de software-hardware com times de engenharia da OpenAI e expertise em silício da Broadcom, além dos próprios modelos da OpenAI para acelerar otimização—os mesmos modelos implantados no ChatGPT ajudaram a engenhosamente construir o hardware que os executa. Broadcom coordenou implementação de silício e silício de rede Tomahawk; Celestica contribuiu placa, rack e integração de sistemas. Amostras estão rodando cargas de trabalho de produção incluindo GPT-5.3-Codex-Spark.
OpenAI planeja implantação até final de 2026, escalando para data centers de nível gigawatt com Microsoft e outros parceiros como parte de um roteiro de plataforma multi-geração. Isso marca a mudança da OpenAI para "construir a stack completa" enquanto demanda de inferência dispara e a empresa busca diversificar fora de Nvidia e reduzir custos por token para ChatGPT de produção. Ações da Broadcom subiram 2–3% com a notícia, refletindo o papel crescente da Broadcom como workshop para silício de IA customizado junto a uma onda de hyperscalers projetando seus próprios chips.