OpenAI, Broadcom desvendam chip de inferência LLM Jalapeño; implantação em escala de gigawatt visada até final de 2026
OpenAI e Broadcom desvendaram Jalapeño em 24 de junho de 2026—um acelerador de inferência de LLM customizado co-projetado em nove meses e já executando GPT-5.3-Codex-Spark em testes de laboratório. O chip é descrito como um "design de página em branco para inferência de LLM moderna, não um acelerador de propósito geral adaptado de cargas de trabalho de IA anteriores." Jalapeño visa implantação em escala de gigawatt até final de 2026 como parte de uma plataforma de computação mais ampla do que apenas um componente independente; o ecossistema circundante (placas, racks, rede, conectividade, entrega de energia) é integral à filosofia de design.
O anúncio segue o projeto Titan da OpenAI (co-desenvolvido com Broadcom e TSMC, visando produção em massa H2 2026 em processo 3nm, com Samsung fornecendo memória HBM4), e marca uma proteção estratégica contra dependência da NVIDIA. OpenAI, Google, Apple, SpaceX, Amazon, Microsoft e Meta estão todos impulsionando silício customizado em 2026 porque a infraestrutura de IA se tornou muito cara, estrategicamente importante e restrita de forma que não pode ser deixada inteiramente nas mãos da Nvidia. Não é uma era pós-Nvidia; é uma era "pós-ingenuidade" em que grandes construtores de infraestrutura agora veem a estratégia de computação como inseparável da estratégia de margem e controle da cadeia de suprimentos.
Broadcom está posicionada como o "arquiteto silencioso" dessa alternativa de chip customizado: em vez de vender aceleradores através de canais de varejo, ela faz parceria com hiperscalers para transformar cargas de trabalho previsíveis e de alto volume em silício sob medida. Os chips resultantes permanecem invisíveis aos usuários finais, mas remodelam a economia dos serviços que tocam. Para OpenAI, possuir silício de inferência é essencial para reduzir o custo por token de servir modelos de fronteira em escala e manter independência operacional de restrições de oferta de GPU. Arquitetos devem esperar que silício customizado capture uma fração crescente de cargas de trabalho de inferência de produção ao longo de 2026–2027.
Fontes
- Primary source
- aimultiple.com
“OpenAI's Project Titan chip, co-developed with Broadcom and fabricated on TSMC's 3nm process, is on track for mass production in H2 2026. Samsung has secured an agreement to supply HBM4 memory for the Titan chip”