OpenAI & Broadcom revelan Jalapeño: Chip de inferencia LLM personalizado apunta a despliegue a escala de gigavatio para finales de 2026
OpenAI y Broadcom revelaron Jalapeño, el primer Intelligence Processor personalizado de OpenAI diseñado específicamente para inferencia de modelos de lenguaje grande. El ciclo de desarrollo de diseño a tape-out tomó solo nueve meses. Muestras de ingeniería ya están ejecutando cargas de trabajo en producción en el laboratorio, incluido GPT-5.3-Codex-Spark, y las pruebas iniciales muestran rendimiento por vatio sustancialmente mejor que el hardware de última generación actual. El chip fue entregado al CEO de OpenAI, Sam Altman, y al CEO de Broadcom, Hock Tan, el 24 de junio.
OpenAI diseñó el chip desde cero alrededor de fundamentos de LLM y patrones de servicio, mientras que Broadcom contribuyó con implementación de silicio, tecnologías de redes incluyendo conmutadores Tomahawk, y Celestica se encargó de placas y sistemas de rack. La arquitectura reduce movimiento de datos y equilibra cómputo, memoria y redes para lograr utilización más cercana al rendimiento teórico máximo. En un acuerdo multianual anunciado en octubre de 2025, las empresas planean desplegar 10 gigavatios de aceleradores de IA personalizados con Microsoft y otros socios, con despliegue inicial apuntando a finales de 2026 y expansión hasta 2029.
Para OpenAI, poseer diseño de hardware de inferencia significa controlar tanto la física como la economía del servicio de consultas. Los ASIC personalizados son menos flexibles que las GPU pero pueden adaptarse a kernels y patrones específicos, potencialmente reduciendo significativamente el costo por token de inferencia. El ciclo de desarrollo de nueve meses—acelerado usando los propios modelos de OpenAI para ayudar a diseñar y optimizar partes del silicio—señala que la barrera de entrada para chips personalizados ha bajado lo suficiente para que laboratorios de IA de frontera construyan internamente. El negocio ASIC de Broadcom, que ya fabrica chips personalizados para otros hiperscalers, obtiene ingresos recurrentes y posicionamiento intelectual como taller para empresas de IA que buscan apalancamiento sobre costos de hardware.
Fuentes
- Primary source
- cnbc.com
“Eight months after announcing a custom chip deal, OpenAI and Broadcom are revealing their first joint project: Jalapeño. The companies are aiming for initial deployment of the Jalapeño chips by the end of 2026.”
- investors.broadcom.com
“Jalapeño was co-developed from initial design to manufacturing tape-out in just nine months, and the custom AI accelerator program represents what may be the fastest ASIC development cycle ever achieved in high-performance advanced semiconductors.”
- venturebeat.com
“By co-developing our industry-leading silicon directly with OpenAI, we are enabling the deployment of gigawatt-scale data centers with Microsoft and other partners beginning in 2026.”