EN VIVO · MIÉ, 24 JUN 2026 --:--:-- ET
Edición Nº 64 GASTO TOTAL $14509.27 ARTÍCULOS HOY 13 TOKENS TOTAL 9.10B
aiexpert
En vivo
Breaking Huang dice a los accionistas que los centros de datos del mercado negro de chips contrabandeados son un "callejón sin salida" Research Google integra el uso de computadora de forma nativa en Gemini 3.5 Flash para automatización de agentes Research Google OpenRL: API auto-hospedada Kubernetes para post-entrenamiento de LLM; desacopla RL de infraestructura Market Micron Q3 supera expectativas con márgenes DRAM de récord; suministro de HBM totalmente asignado hasta 2026 Policy EE.UU. asegura los Países Bajos para alianéa de chips Pax Silica; tensiones ASML persisten sobre restricciones de exportación de la Ley MATCH Chips OpenAI & Broadcom revelan Jalapeño: Chip de inferencia LLM personalizado apunta a despliegue a escala de gigavatio para finales de 2026 Breaking Gemini 3.5 Flash agrega computer use nativo; framework de agente ahora predeterminado en Search Research La IA diseña rápidamente chips de radiofrecuencia novedosos más allá de la intuición humana, reduciendo años de trabajo a horas Chips El supercomputador LineShine de China encabeza el TOP500 con 2.198 exaflops solo con CPU, terminando el reinado de El Capitan de EE. UU. Market Las acciones de Cerebras se desploman 17% después de error de orientación de margen, CEO dice que la advertencia fue 'malinterpretada' Market Sunrun, Tesla y Renew Home forman planta de energía virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi rediseñado, planificando lanzamiento de servicio pagado a finales de 2026 Funding XCures cierra ronda Series B de $46M con valoración post-dinero de $127M Funding Qualcomm adquiere Modular por ~$4B para fortalecer stack de software de IA y operación de data center Chips OpenAI y Broadcom revelan Jalapeño, chip de inferencia LLM personalizado con ciclo de diseño de 9 meses Chips SK Hynix envía muestras de memoria HBM4E: 16Gbps, 48GB por stack, ganancia de potencia del 20% Funding Qualcomm en negociaciones para adquirir Tenstorrent por $8–10B, expandiendo cartera de chips de IA RISC-V Chips TSMC sube precios de nodos avanzados 5–10% en todos los nodos 7nm e más nuevos Chips OpenAI y Broadcom presentan chip de inferencia personalizado Jalapeño Chips Proyecto de chip personalizado OpenAI-Broadcom se estanca; Broadcom exige garantía de compra de Microsoft antes de financiar Breaking Huang dice a los accionistas que los centros de datos del mercado negro de chips contrabandeados son un "callejón sin salida" Research Google integra el uso de computadora de forma nativa en Gemini 3.5 Flash para automatización de agentes Research Google OpenRL: API auto-hospedada Kubernetes para post-entrenamiento de LLM; desacopla RL de infraestructura Market Micron Q3 supera expectativas con márgenes DRAM de récord; suministro de HBM totalmente asignado hasta 2026 Policy EE.UU. asegura los Países Bajos para alianéa de chips Pax Silica; tensiones ASML persisten sobre restricciones de exportación de la Ley MATCH Chips OpenAI & Broadcom revelan Jalapeño: Chip de inferencia LLM personalizado apunta a despliegue a escala de gigavatio para finales de 2026 Breaking Gemini 3.5 Flash agrega computer use nativo; framework de agente ahora predeterminado en Search Research La IA diseña rápidamente chips de radiofrecuencia novedosos más allá de la intuición humana, reduciendo años de trabajo a horas Chips El supercomputador LineShine de China encabeza el TOP500 con 2.198 exaflops solo con CPU, terminando el reinado de El Capitan de EE. UU. Market Las acciones de Cerebras se desploman 17% después de error de orientación de margen, CEO dice que la advertencia fue 'malinterpretada' Market Sunrun, Tesla y Renew Home forman planta de energía virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi rediseñado, planificando lanzamiento de servicio pagado a finales de 2026 Funding XCures cierra ronda Series B de $46M con valoración post-dinero de $127M Funding Qualcomm adquiere Modular por ~$4B para fortalecer stack de software de IA y operación de data center Chips OpenAI y Broadcom revelan Jalapeño, chip de inferencia LLM personalizado con ciclo de diseño de 9 meses Chips SK Hynix envía muestras de memoria HBM4E: 16Gbps, 48GB por stack, ganancia de potencia del 20% Funding Qualcomm en negociaciones para adquirir Tenstorrent por $8–10B, expandiendo cartera de chips de IA RISC-V Chips TSMC sube precios de nodos avanzados 5–10% en todos los nodos 7nm e más nuevos Chips OpenAI y Broadcom presentan chip de inferencia personalizado Jalapeño Chips Proyecto de chip personalizado OpenAI-Broadcom se estanca; Broadcom exige garantía de compra de Microsoft antes de financiar
Research

Google OpenRL: API auto-hospedada Kubernetes para post-entrenamiento de LLM; desacopla RL de infraestructura

GKE Labs de Google lanzó OpenRL, una API de entrenamiento auto-hospedada de código abierto para ejecutar workflows de post-entrenamiento de aprendizaje por refuerzo en clusters Kubernetes. OpenRL abstrae la complejidad de infraestructura de RL de la investigación de IA, permitiendo a investigadores desarrollar bucles RL agenénicos en compute estándar (e.g., una MacBook) mientras que ingenieros de infraestructura manejan escalado, orquestación y asignación de hardware en clusters compartidos. El diseño desacopla dos preocupaciones que están "estrechamente mezcladas" en frameworks actuales como TRL y DeepSpeed: lógica de investigación de IA (bucle RL, diseño de recompensa) y ejecución de infraestructura (aprovisionamiento, gestión de memoria, programación de hardware).

Los bucles de entrenamiento RL tradicionales son estrictamente secuenciales: el entrenador espera al muestreador, el muestreador espera a la puntuación de recompensa (a menudo vinculado a CPU/red), las GPU permanecen inactivas. OpenRL permite que trabajos RL concurrentes saturen la utilización de GPU. Ejecutar 1 trabajo deja brechas; ejecutar 3 trabajos concurrentes logra ciclos de duty GPU casi continuos. El sistema utiliza el patrón Tinker (cuatro APIs: I/O de datos, actualizaciones de pesos, muestreo, guardado de punto de control) e integra con Tinker-Cookbook. OpenRL soporta fine-tuning LoRA de Gemma y otros modelos base. Google incluyó una "receta autoresearch" (inspirada en el trabajo de Karpathy) que permite experimentos paralelos para barrido de hiperparámetros y refinamiento de señal de recompensa en tareas text-to-sql.

La arquitectura es vista previa de investigación, enfocada en fine-tuning solo LoRA por ahora. El roadmap futuro incluye soporte de modelo más amplio e integración más cercana con pipelines KubeFlow. OpenRL se ejecuta en macOS, GPUs NVIDIA y GKE, permitiendo a investigadores iterar localmente mientras escalan el post-entrenamiento de producción a despliegues Kubernetes multi-nodo.

Para arquitectos: OpenRL es una capa de abstracción en fase inicial que desbloquea dos flujos de trabajo: (1) investigadores pueden prototipar RL agenénico sin hardware de GPU, apuntando a APIs de cluster remoto; (2) equipos de ops pueden empaquetar múltiples trabajos RL concurrentes para amortizar costos de infraestructura. La limitación: solo LoRA (basado en adaptadores, no sintonización de modelo completo). Si se adopta, este modelo (preocupaciones separadas de investigación e infraestructura) podría estandarizar cómo las empresas ejecutan post-entrenamiento multi-agente a escala. Observe si este patrón se extiende a otros frameworks RL (NVIDIA NeMo RL, Hugging Face TRL) o permanece céntrico a Google.

Fuentes