OpenAI & Broadcom revelam Jalapeño: Chip de inferência LLM customizado visa deployment em escala de gigawatt até final de 2026
OpenAI e Broadcom revelaram Jalapeño, o primeiro Intelligence Processor customizado da OpenAI projetado especificamente para inferência de modelos de linguagem. O desenvolvimento do design para tape-out levou apenas nove meses. Amostras de engenharia já estão rodando cargas de trabalho em produção no laboratório, incluindo GPT-5.3-Codex-Spark, e testes iniciais mostram performance por watt substancialmente melhor que hardware de ponta atual. O chip foi entregue ao CEO da OpenAI, Sam Altman, e ao CEO da Broadcom, Hock Tan, em 24 de junho.
A OpenAI projetou o chip do zero ao redor de fundamentos de LLM e padrões de serving, enquanto a Broadcom contribuiu com implementação de silício, tecnologias de networking incluindo switching Tomahawk, e Celestica cuidou de placas e sistemas de rack. A arquitetura reduz movimento de dados e equilibra computação, memória e networking para alcançar utilização mais próxima à performance teórica máxima. Em um acordo plurianual anunciado em outubro de 2025, as empresas planejam deployar 10 gigawatts de aceleradores de IA customizados com Microsoft e outros parceiros, com deployment inicial visando final de 2026 e expansão até 2029.
Para a OpenAI, possuir design de hardware de inferência significa controlar tanto a física quanto a economia do serving de queries. ASICs customizados são menos flexíveis que GPUs, mas podem ser sintonizados para kernels e padrões específicos, potencialmente reduzindo o custo por token de inferência significativamente. O ciclo de desenvolvimento de nove meses—acelerado usando os próprios modelos da OpenAI para ajudar a projetar e otimizar partes do silício—sinaliza que a barreira para entrada em chips customizados caiu o suficiente para laboratórios de IA de ponta construirem in-house. O negócio ASIC da Broadcom, que já fabrica chips customizados para outros hyperscalers, ganha receita recorrente e posicionamento intelectual como oficina para empresas de IA buscando alavancagem sobre custos de hardware.
Fontes
- Primary source
- cnbc.com
“Eight months after announcing a custom chip deal, OpenAI and Broadcom are revealing their first joint project: Jalapeño. The companies are aiming for initial deployment of the Jalapeño chips by the end of 2026.”
- investors.broadcom.com
“Jalapeño was co-developed from initial design to manufacturing tape-out in just nine months, and the custom AI accelerator program represents what may be the fastest ASIC development cycle ever achieved in high-performance advanced semiconductors.”
- venturebeat.com
“By co-developing our industry-leading silicon directly with OpenAI, we are enabling the deployment of gigawatt-scale data centers with Microsoft and other partners beginning in 2026.”