OpenAI, Broadcom revelam Jalapeño: chip customizado de inferência LLM projetado em 9 meses
OpenAI e Broadcom revelaram Jalapeño, o primeiro chip de IA customizado da OpenAI, desenvolvido para lidar de forma mais eficiente com as necessidades computacionais do ChatGPT e do agente de codificação Codex da OpenAI. Testes iniciais mostram que Jalapeño entregará desempenho por watt substancialmente melhor do que o estado da arte atual, com uma redução estimada de 50% nos custos de inferência. O acelerador customizado foi projetado especificamente para inferência de modelos de linguagem grandes e passou do design à produção em apenas nove meses, com o desenvolvimento utilizando os próprios modelos da OpenAI para acelerar partes do design do chip.
Amostras de engenharia do chip Jalapeño estão executando cargas de trabalho de ML no laboratório em frequência alvo de produção e potência, incluindo GPT-5.3-Codex-Spark. A OpenAI planeja implantar o chip em escala de gigawatt com parceiros de data center como a Microsoft começando em 2026, com a Microsoft esperada de comprar 40% dos chips para garantir a primeira fase.
Para arquitetos, Jalapeño sinaliza a mudança da OpenAI em direção à integração vertical: controlar o stack completo de inferência de chip a produto para reduzir custos e reduzir dependência da NVIDIA. O turnaround de 9 meses—tipicamente 1,5–2 anos para silício customizado—demonstra a vantagem de velocidade do design de chip assistido por IA. Se as afirmações de desempenho se sustentarem em escala, isso move a agulha nos custos de unidade de inferência em toda a indústria.
Fontes
- Primary source
- OpenAI just announced its first custom chip to help ChatGPT run better | CNN Business
- OpenAI and Broadcom announce first custom AI chip
- Broadcom and OpenAI unveil custom-built Jalapeño inference processor | Tom's Hardware
- OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom | VentureBeat