OpenAI, Broadcom revelan Jalapeño: chip de inferencia LLM personalizado diseñado en 9 meses
OpenAI y Broadcom revelaron Jalapeño, el primer chip de IA personalizado de OpenAI, desarrollado para manejar de manera más eficiente las necesidades computacionales de ChatGPT y del agente de codificación Codex de OpenAI. Las pruebas tempranas muestran que Jalapeño entregará un rendimiento por vatio sustancialmente mejor que el estado del arte actual, con una reducción estimada del 50% en los costos de inferencia. El acelerador personalizado fue diseñado específicamente para inferencia de grandes modelos de lenguaje y pasó de diseño a producción en solo nueve meses, con el desarrollo utilizando los propios modelos de OpenAI para acelerar partes del diseño del chip.
Las muestras de ingeniería del chip Jalapeño están ejecutando cargas de trabajo de ML en el laboratorio a frecuencia de destino de producción y potencia, incluido GPT-5.3-Codex-Spark. OpenAI planea implementar el chip a escala de gigavatio con socios de centros de datos como Microsoft comenzando en 2026, con Microsoft esperado comprar el 40% de los chips para asegurar la primera fase.
Para arquitectos, Jalapeño señala el cambio de OpenAI hacia la integración vertical: controlar el stack completo de inferencia desde el chip hasta el producto para reducir costos y reducir la dependencia de NVIDIA. El tiempo de entrega de 9 meses—típicamente 1.5–2 años para silicio personalizado—demuestra la ventaja de velocidad del diseño de chip asistido por IA. Si las afirmaciones de desempeño se mantienen a escala, esto mueve la aguja en la economía de unidades de inferencia en toda la industria.
Fuentes
- Primary source
- OpenAI just announced its first custom chip to help ChatGPT run better | CNN Business
- OpenAI and Broadcom announce first custom AI chip
- Broadcom and OpenAI unveil custom-built Jalapeño inference processor | Tom's Hardware
- OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom | VentureBeat