OpenAI y Broadcom revelan Jalapeño, chip de inferencia LLM personalizado con ciclo de diseño de 9 meses
OpenAI y Broadcom revelaron Jalapeño el miércoles, el primer acelerador de IA personalizado de OpenAI, co-desarrollado en solo nueve meses de diseño a tape-out de fabricación. El "Procesador de Inteligencia" se arquitecturó desde cero alrededor de cargas de trabajo de inferencia LLM, optimizado para reducir movimiento de datos y balancear computación, memoria y networking para lograr utilización más cercana al desempenho pico teórico. Pruebas tempranas en laboratorio muestran que Jalapeño entrega sustancialmente mejor rendimiento por vatio que estado-del-arte actual y ahorros de costo alrededor del 50% comparado con GPUs típicos, según el CEO Hock Tan de Broadcom.
El proceso de diseño aprovechó co-desarrollo profundo de software-hardware con equipos de ingeniería de OpenAI y experiencia en silicio de Broadcom, además de modelos propios de OpenAI para acelerar optimización—los mismos modelos desplegados en ChatGPT ayudaron a ingeniar el hardware que los ejecuta. Broadcom manejó implementación de silicio y silicio de networking Tomahawk; Celestica contribuyó placa, rack e integración de sistemas. Las muestras están ejecutando cargas de trabajo de producción incluyendo GPT-5.3-Codex-Spark.
OpenAI planea implementación a fin de 2026, escalando a data centers de nivel gigawatt con Microsoft y otros socios como parte de un roadmap multi-generacional. Esto marca el cambio de OpenAI a "construir la pila completa" mientras la demanda de inferencia se dispara y la empresa busca diversificarse de Nvidia y reducir costos por token para ChatGPT de producción. Las acciones de Broadcom subieron 2–3% con la noticia, reflejando el papel creciente de Broadcom como taller para silicio de IA personalizado junto a una onda de hyperscalers diseñando sus propios chips.