OpenAI revela chip Jalapeño para inferencia con Broadcom, objetivo de implementación a finales de 2026
OpenAI y Broadcom anunciaron el miércoles Jalapeño, el primer chip acelerador de IA personalizado de OpenAI diseñado específicamente para inferencia de modelos de lenguaje grande. Las empresas afirman que las pruebas internas iniciales muestran un rendimiento por vatio sustancialmente mejor que los sistemas estado del arte actual, aunque los benchmarks finales aún no se han publicado. El chip fue desarrollado de diseño a tape-out en nueve meses, un turnaround inusualmente rápido que OpenAI atribuye al uso de sus propios modelos para acelerar partes del proceso de diseño de hardware.
Jalapeño es un ASIC construido a propósito con un chiplet de cómputo masivo (~840mm² die del tamaño del reticle) rodeado por seis módulos de memoria HBM y optimizado para inferencia de baja latencia y alto rendimiento. A diferencia de las GPU de propósito general, la arquitectura está ajustada en torno a los patrones de servicio de LLM, movimiento de memoria y eficiencia de red—equilibrando cómputo, memoria e I/O para operar más cerca de la utilización máxima teórica. Broadcom maneja la fabricación de silicio y contribuye con su silicio de red Tomahawk; Celestica proporciona integración de rack y placa.
El despliegue comienza a escala de gigavatio a finales de 2026 a través de Microsoft y otros socios, con producción inicial de prototipo a finales de 2026 escalando en los años siguientes. El presidente de OpenAI, Greg Brockman, dijo a CNBC que OpenAI no puede obtener cómputo lo suficientemente rápido, lo que subraya la presión de infraestructura que impulsa la asociación. El CEO de Broadcom, Hock Tan, señaló que la demanda de cómputo de los seis clientes hyperscaler de la empresa es insaciable y se espera que permanezca elevada hasta 2028.
Para arquitectos de IA, Jalapeño señala el movimiento de OpenAI para poseer la pila completa—desde modelos a hardware de inferencia—para reducir costos y latencia en el servicio. Esto importa porque OpenAI controla tanto la carga de trabajo como el silicio, permitiendo cooptimización hardware-software más ajustada de lo que las GPU de serie pueden entregar. El ciclo de diseño de nueve meses y los planes de escala de gigavatio sugieren una alternativa creíble al dominio de NVIDIA en infraestructura de inferencia, aunque los números de rendimiento concreto aún están pendientes.
Fuentes
- Primary source
- openai.com
“Jalapeño was delivered to OpenAI CEO Sam Altman and President Greg Brockman by Broadcom President and CEO Hock Tan and President Charlie Kawwas, marking an important step in OpenAI's strategy to build the full stack behind its models and products.”
- cnbc.com
“OpenAI President Greg Brockman told CNBC's David Faber on Wednesday that the chips were designed from end to end in nine months with help from the company's own models. Brockman told CNBC that OpenAI 'cannot get compute fast enough,' and Broadcom CEO Hock Tan backed up that take, saying compute demand from the company's six customers is 'simply insatiable.'”
- venturebeat.com
“Jalapeño's engineering timeline set a blistering pace for the semiconductor industry, moving from early schematics to fabrication readiness within a brief nine-month window, when new processor development cycles are typically measured in years.”