OpenAI e Broadcom revelam chip de inferência customizado Jalapeño
OpenAI e Broadcom revelaram o Jalapeño, um "Processador de Inteligência" ASIC customizado para inferência de LLMs, marcando a primeira entrada de OpenAI no mercado de silício. O chip foi projetado em nove meses do conceito até tape-out usando co-desenvolvimento de software-hardware, e visa entrega melhor performance por watt do que aceleradores state-of-the-art. Broadcom irá fabricar o silício enquanto Celestica constrói os sistemas servidores e racks.
OpenAI planeja implantação inicial do Jalapeño até o final de 2026, com roadmap direcionado para implantações de centros de dados em escala de gigawatts nas instalações OpenAI e centros de dados de parceiros, incluindo Microsoft. A plataforma usará soluções de rede Broadcom Tomahawk para escala. Testes iniciais em frequência alvo de produção e potência mostram eficiência melhorada em workloads LLM chave incluindo GPT-5.3-Codex-Spark. As ações Broadcom subiram cerca de 2% no anúncio.
Para OpenAI, o movimento é um passo em direção à construção da stack completa de IA e redução de dependência em relação a Nvidia. Arquitetos implementando sistemas de IA em produção se importam porque silício de inferência customizado — otimizado para um workload estreito ao invés de GPUs de uso geral — pode reduzir latência e custos por-inferência em escala, assumindo que as reivindicações de performance por watt do Jalapeño se mantêm e os cronogramas de implantação se cumprem.
Fontes
- Primary source
- cnbc.com
“OpenAI and Broadcom on Wednesday unveiled their debut custom chip, called Jalapeño, marking the ChatGPT maker's first entry into artificial intelligence silicon.”
- stocktitan.net
“The chip was co-developed and taken from design to tape-out in nine months, targets substantially better performance per watt than current state-of-the-art based on early testing, and will underpin a multi-generation platform for gigawatt-scale data centers with Microsoft and other partners starting in 2026.”
- marketscreener.com
“The Jalapeño processor is designed to work speedily and efficiently with the large language models (LLMs) that power many AI applications.”