EN VIVO · LUN, 29 JUN 2026 --:--:-- ET
Edición Nº 69 GASTO TOTAL $14606.44 ARTÍCULOS HOY 3 TOKENS TOTAL 9.24B
aiexpert
En vivo
Chips Samsung envía muestras de HBM4E líderes de la industria a 16Gbps, 48GB por stack; ganancia de velocidad de 20%+ sobre HBM4 Market Micron guía $50 mil millones Q4, márgenes del 86%; firma 16 acuerdos con clientes estratégicos valorados en ~$100 mil millones Chips Acelerador de inferencia d-Matrix Corsair entra en producción total; afirma 10x más rápido decodificar que sólo GPU con 5x menos energía Market SoftBank se compromete con €75 mil millones para construir 5 GW de capacidad de data center de IA en Francia hasta 2031 Funding Gobierno del Reino Unido respalda iniciativa de capital de riesgo de £400 millones para gestores de fondos diversos Chips Plataforma NVIDIA Blackwell llega; GPUs B200/B300 con velocidad de inferencia 4x más rápida que H100, costo/energía 25x menor Breaking HP implementa Frontier de OpenAI en operaciones empresariales; se une a seis adoptadores de plataforma inaugural Market 79% de la capacidad global de data centers de IA enfrenta riesgo elevado de peligros climáticos; operadores se desplazan a zonas rurales y de clima extremo Funding Kunlunxin de Baidu apunta a OPI en Hong Kong de $50B, vinculando compras de chips a asignaciones Funding Momenta lanza IPO en Hong Kong apuntando a $751M para I+D de conducción autónoma Chips HBM ahora comprende 35-47% de la BOM del acelerador de IA; HBM de GB200 solo cuesta $4.800/unidad Market Ingresos HBM4 de Samsung superan $1 mil millones; apunta a tasa de ejecución de $10 mil millones para finales de 2026 Chips OpenAI, Broadcom desvelan chip de inferencia LLM Jalapeño; despliegue a escala de gigavatio apuntado para finales de 2026 Market TSMC advierte que la escasez de chips de IA persistirá hasta 2027; señala aumento de precio 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodificación especulativa reduce latencia de inferencia 85%, llega a Together AI Breaking OpenAI lanza red de socios de $150M para certificar a 300K consultores antes de fin de año Breaking HP se convierte en adoptante principal de Frontier; OpenAI escala plataforma de agente de IA empresarial con asociaciones de consultoría Breaking Apple solicita a la Casa Blanca aprobación de CXMT conforme los costos de memoria golpean aumentos de MacBook e iPad del 20% Funding Samsung, SK Hynix planean capex de $1,3B durante una década bajo demanda de memoria para IA Breaking Lenovo, NVIDIA Asociación en AI Cloud Gigafactory; Reducen Timelines de Implementación de Servidor de Inferencia de Meses a Semanas Chips Samsung envía muestras de HBM4E líderes de la industria a 16Gbps, 48GB por stack; ganancia de velocidad de 20%+ sobre HBM4 Market Micron guía $50 mil millones Q4, márgenes del 86%; firma 16 acuerdos con clientes estratégicos valorados en ~$100 mil millones Chips Acelerador de inferencia d-Matrix Corsair entra en producción total; afirma 10x más rápido decodificar que sólo GPU con 5x menos energía Market SoftBank se compromete con €75 mil millones para construir 5 GW de capacidad de data center de IA en Francia hasta 2031 Funding Gobierno del Reino Unido respalda iniciativa de capital de riesgo de £400 millones para gestores de fondos diversos Chips Plataforma NVIDIA Blackwell llega; GPUs B200/B300 con velocidad de inferencia 4x más rápida que H100, costo/energía 25x menor Breaking HP implementa Frontier de OpenAI en operaciones empresariales; se une a seis adoptadores de plataforma inaugural Market 79% de la capacidad global de data centers de IA enfrenta riesgo elevado de peligros climáticos; operadores se desplazan a zonas rurales y de clima extremo Funding Kunlunxin de Baidu apunta a OPI en Hong Kong de $50B, vinculando compras de chips a asignaciones Funding Momenta lanza IPO en Hong Kong apuntando a $751M para I+D de conducción autónoma Chips HBM ahora comprende 35-47% de la BOM del acelerador de IA; HBM de GB200 solo cuesta $4.800/unidad Market Ingresos HBM4 de Samsung superan $1 mil millones; apunta a tasa de ejecución de $10 mil millones para finales de 2026 Chips OpenAI, Broadcom desvelan chip de inferencia LLM Jalapeño; despliegue a escala de gigavatio apuntado para finales de 2026 Market TSMC advierte que la escasez de chips de IA persistirá hasta 2027; señala aumento de precio 3nm de 15% H2 2026 Research DeepSeek V4 DSpark decodificación especulativa reduce latencia de inferencia 85%, llega a Together AI Breaking OpenAI lanza red de socios de $150M para certificar a 300K consultores antes de fin de año Breaking HP se convierte en adoptante principal de Frontier; OpenAI escala plataforma de agente de IA empresarial con asociaciones de consultoría Breaking Apple solicita a la Casa Blanca aprobación de CXMT conforme los costos de memoria golpean aumentos de MacBook e iPad del 20% Funding Samsung, SK Hynix planean capex de $1,3B durante una década bajo demanda de memoria para IA Breaking Lenovo, NVIDIA Asociación en AI Cloud Gigafactory; Reducen Timelines de Implementación de Servidor de Inferencia de Meses a Semanas
Chips

Acelerador de inferencia d-Matrix Corsair entra en producción total; afirma 10x más rápido decodificar que sólo GPU con 5x menos energía

d-Matrix anunció que su plataforma acelerador de inferencia Corsair entró en producción total el 9 de junio, con envíos en volumen comenzando hacia hiperscaladores prioritarios, neoclouds y laboratorios de IA de frontera. El acelerador de chiplet basado en SRAM, fabricado en el proceso N6 de TSMC a través de Alchip Technologies, está diseñado específicamente para la fase de decodificación de cargas de trabajo de inferencia en clusters de cómputo heterogéneo emparejados con GPUs. La empresa cita pruebas independientes de Gimlet Labs mostrando que las configuraciones emparejadas de Corsair + GPU reducen tiempos de respuesta de inferencia de aproximadamente 24 segundos a menos de dos segundos, aproximadamente 10x aceleración versus enfoques sólo GPU.

Corsair evita el muro de memoria integrando cómputo fuertemente con SRAM en chip, evitando las limitaciones de suministro de DRAM y memoria de alto ancho de banda (HBM) que afectan a arquitecturas competidoras. Cada tarjeta PCIe empaca 4 GB de Memoria de Rendimiento con ancho de banda de 300 TB/s, alcanzando cómputo de pico de 4,800 TFLOPs para MXINT8 y 19,200 TFLOPs para MXINT4. d-Matrix posiciona Corsair como complementario a GPUs en lugar de un reemplazo, dirigido a aplicaciones agentic de IA sensibles a la latencia incluyendo Claude Code, agentes de voz y asistentes de codificación interactiva que exigen generación rápida de tokens.

El tiempo se alinea con la demanda creciente de arquitecturas de inferencia desagregadas conforme las cargas de trabajo agentic empujan la infraestructura sólo GPU a sus límites. d-Matrix ha asegurado servicios plurianuales de suministro y fabricación; la empresa también adquirió el negocio de data center de GigaIO en abril, trayendo experiencia en sistemas de escala de rack que culmina en SquadRack, un diseño de referencia listo para producción construido con Arista, Broadcom y Supermicro. El brazo de riesgo M12 de Microsoft y Temasek son inversores; la startup recaudó $275 millones en Serie C.

Para equipos de infraestructura, Corsair entrando en producción en volumen marca un cambio en la economía de inferencia: clusters heterogéneos dividiendo prefill para GPUs y decodificar para aceleradores especializados ahora tienen una alternativa validada en producción, de suministro predecible de proceso N6 y arquitectura SRAM. Los operadores ahora tienen un punto de diferenciación táctica al evitar cuellos de botella de asignación de HBM en deslocamientos de inferencia restringidos por latencia.

Fuentes