OpenAI, Broadcom desvelan chip de inferencia LLM Jalapeño; despliegue a escala de gigavatio apuntado para finales de 2026
OpenAI y Broadcom desvelaron Jalapeño el 24 de junio de 2026—un acelerador de inferencia de LLM personalizado co-diseñado en nueve meses y ya ejecutando GPT-5.3-Codex-Spark en pruebas de laboratorio. El chip se describe como un "diseño de página en blanco para inferencia de LLM moderna, no un acelerador de propósito general adaptado de cargas de trabajo de IA anteriores." Jalapeño apunta al despliegue a escala de gigavatio para finales de 2026 como parte de una plataforma de cómputo más amplia que un componente independiente; el ecosistema circundante (placas, racks, redes, conectividad, entrega de energía) es integral a la filosofía de diseño.
El anuncio sigue al proyecto Titan de OpenAI (co-desarrollado con Broadcom y TSMC, apuntando a producción en masa H2 2026 en proceso 3nm, con Samsung suministrando memoria HBM4), y marca un cobertor estratégico contra dependencia de NVIDIA. OpenAI, Google, Apple, SpaceX, Amazon, Microsoft y Meta están impulsando silicio personalizado en 2026 porque la infraestructura de IA se ha vuelto demasiado cara, estratégicamente importante y restringida de oferta para dejarla enteramente en manos de Nvidia. No es una era post-Nvidia; es una era "post-ingenua" donde los grandes constructores de infraestructura ahora ven la estrategia de cómputo como inseparable de la estrategia de margen y el control de la cadena de suministro.
Broadcom se posiciona como el "arquitecto silencioso" de esta alternativa de chip personalizado: en lugar de vender aceleradores a través de canales minoristas, se asocia con hiperscalers para convertir cargas de trabajo predecibles y de alto volumen en silicio a medida. Los chips resultantes permanecen invisibles para los usuarios finales, pero remodelan la economía de los servicios que tocan. Para OpenAI, poseer silicio de inferencia es esencial para reducir el costo por token de servir modelos fronterizos a escala y mantener independencia operacional de restricciones de oferta de GPU. Los arquitectos deben esperar que el silicio personalizado capture una fracción creciente de cargas de trabajo de inferencia de producción durante 2026–2027.
Fuentes
- Primary source
- aimultiple.com
“OpenAI's Project Titan chip, co-developed with Broadcom and fabricated on TSMC's 3nm process, is on track for mass production in H2 2026. Samsung has secured an agreement to supply HBM4 memory for the Titan chip”