EN VIVO · MIÉ, 24 JUN 2026 --:--:-- ET
Edición Nº 64 GASTO TOTAL $14510.26 ARTÍCULOS HOY 14 TOKENS TOTAL 9.10B
aiexpert
En vivo
Market Micron reporta ingresos Q3 de $41,5 mil millones, guía $50 mil millones para Q4 en superciclo de memoria de IA Funding Qualcomm adquiere Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA de NVIDIA Market AWS lanza instancias EC2 G7 con NVIDIA RTX PRO 4500 Blackwell; ganancias de inferencia de 4.6x Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete con volúmenes de producción en 2028 Chips OpenAI revela chip Jalapeño para inferencia con Broadcom, objetivo de implementación a finales de 2026 Breaking Huang dice a los accionistas que los centros de datos del mercado negro de chips contrabandeados son un "callejón sin salida" Research Google integra el uso de computadora de forma nativa en Gemini 3.5 Flash para automatización de agentes Research Google OpenRL: API auto-hospedada Kubernetes para post-entrenamiento de LLM; desacopla RL de infraestructura Market Micron Q3 supera expectativas con márgenes DRAM de récord; suministro de HBM totalmente asignado hasta 2026 Policy EE.UU. asegura los Países Bajos para alianéa de chips Pax Silica; tensiones ASML persisten sobre restricciones de exportación de la Ley MATCH Chips OpenAI & Broadcom revelan Jalapeño: Chip de inferencia LLM personalizado apunta a despliegue a escala de gigavatio para finales de 2026 Breaking Gemini 3.5 Flash agrega computer use nativo; framework de agente ahora predeterminado en Search Research La IA diseña rápidamente chips de radiofrecuencia novedosos más allá de la intuición humana, reduciendo años de trabajo a horas Chips El supercomputador LineShine de China encabeza el TOP500 con 2.198 exaflops solo con CPU, terminando el reinado de El Capitan de EE. UU. Market Las acciones de Cerebras se desploman 17% después de error de orientación de margen, CEO dice que la advertencia fue 'malinterpretada' Market Sunrun, Tesla y Renew Home forman planta de energía virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi rediseñado, planificando lanzamiento de servicio pagado a finales de 2026 Funding XCures cierra ronda Series B de $46M con valoración post-dinero de $127M Funding Qualcomm adquiere Modular por ~$4B para fortalecer stack de software de IA y operación de data center Chips OpenAI y Broadcom revelan Jalapeño, chip de inferencia LLM personalizado con ciclo de diseño de 9 meses Market Micron reporta ingresos Q3 de $41,5 mil millones, guía $50 mil millones para Q4 en superciclo de memoria de IA Funding Qualcomm adquiere Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA de NVIDIA Market AWS lanza instancias EC2 G7 con NVIDIA RTX PRO 4500 Blackwell; ganancias de inferencia de 4.6x Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete con volúmenes de producción en 2028 Chips OpenAI revela chip Jalapeño para inferencia con Broadcom, objetivo de implementación a finales de 2026 Breaking Huang dice a los accionistas que los centros de datos del mercado negro de chips contrabandeados son un "callejón sin salida" Research Google integra el uso de computadora de forma nativa en Gemini 3.5 Flash para automatización de agentes Research Google OpenRL: API auto-hospedada Kubernetes para post-entrenamiento de LLM; desacopla RL de infraestructura Market Micron Q3 supera expectativas con márgenes DRAM de récord; suministro de HBM totalmente asignado hasta 2026 Policy EE.UU. asegura los Países Bajos para alianéa de chips Pax Silica; tensiones ASML persisten sobre restricciones de exportación de la Ley MATCH Chips OpenAI & Broadcom revelan Jalapeño: Chip de inferencia LLM personalizado apunta a despliegue a escala de gigavatio para finales de 2026 Breaking Gemini 3.5 Flash agrega computer use nativo; framework de agente ahora predeterminado en Search Research La IA diseña rápidamente chips de radiofrecuencia novedosos más allá de la intuición humana, reduciendo años de trabajo a horas Chips El supercomputador LineShine de China encabeza el TOP500 con 2.198 exaflops solo con CPU, terminando el reinado de El Capitan de EE. UU. Market Las acciones de Cerebras se desploman 17% después de error de orientación de margen, CEO dice que la advertencia fue 'malinterpretada' Market Sunrun, Tesla y Renew Home forman planta de energía virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi rediseñado, planificando lanzamiento de servicio pagado a finales de 2026 Funding XCures cierra ronda Series B de $46M con valoración post-dinero de $127M Funding Qualcomm adquiere Modular por ~$4B para fortalecer stack de software de IA y operación de data center Chips OpenAI y Broadcom revelan Jalapeño, chip de inferencia LLM personalizado con ciclo de diseño de 9 meses
Chips

OpenAI revela chip Jalapeño para inferencia con Broadcom, objetivo de implementación a finales de 2026

OpenAI y Broadcom anunciaron el miércoles Jalapeño, el primer chip acelerador de IA personalizado de OpenAI diseñado específicamente para inferencia de modelos de lenguaje grande. Las empresas afirman que las pruebas internas iniciales muestran un rendimiento por vatio sustancialmente mejor que los sistemas estado del arte actual, aunque los benchmarks finales aún no se han publicado. El chip fue desarrollado de diseño a tape-out en nueve meses, un turnaround inusualmente rápido que OpenAI atribuye al uso de sus propios modelos para acelerar partes del proceso de diseño de hardware.

Jalapeño es un ASIC construido a propósito con un chiplet de cómputo masivo (~840mm² die del tamaño del reticle) rodeado por seis módulos de memoria HBM y optimizado para inferencia de baja latencia y alto rendimiento. A diferencia de las GPU de propósito general, la arquitectura está ajustada en torno a los patrones de servicio de LLM, movimiento de memoria y eficiencia de red—equilibrando cómputo, memoria e I/O para operar más cerca de la utilización máxima teórica. Broadcom maneja la fabricación de silicio y contribuye con su silicio de red Tomahawk; Celestica proporciona integración de rack y placa.

El despliegue comienza a escala de gigavatio a finales de 2026 a través de Microsoft y otros socios, con producción inicial de prototipo a finales de 2026 escalando en los años siguientes. El presidente de OpenAI, Greg Brockman, dijo a CNBC que OpenAI no puede obtener cómputo lo suficientemente rápido, lo que subraya la presión de infraestructura que impulsa la asociación. El CEO de Broadcom, Hock Tan, señaló que la demanda de cómputo de los seis clientes hyperscaler de la empresa es insaciable y se espera que permanezca elevada hasta 2028.

Para arquitectos de IA, Jalapeño señala el movimiento de OpenAI para poseer la pila completa—desde modelos a hardware de inferencia—para reducir costos y latencia en el servicio. Esto importa porque OpenAI controla tanto la carga de trabajo como el silicio, permitiendo cooptimización hardware-software más ajustada de lo que las GPU de serie pueden entregar. El ciclo de diseño de nueve meses y los planes de escala de gigavatio sugieren una alternativa creíble al dominio de NVIDIA en infraestructura de inferencia, aunque los números de rendimiento concreto aún están pendientes.

Fuentes