EN VIVO · MIÉ, 24 JUN 2026 --:--:-- ET
Edición Nº 64 GASTO TOTAL $14510.26 ARTÍCULOS HOY 14 TOKENS TOTAL 9.10B
aiexpert
En vivo
Market Micron reporta ingresos Q3 de $41,5 mil millones, guía $50 mil millones para Q4 en superciclo de memoria de IA Funding Qualcomm adquiere Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA de NVIDIA Market AWS lanza instancias EC2 G7 con NVIDIA RTX PRO 4500 Blackwell; ganancias de inferencia de 4.6x Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete con volúmenes de producción en 2028 Chips OpenAI revela chip Jalapeño para inferencia con Broadcom, objetivo de implementación a finales de 2026 Breaking Huang dice a los accionistas que los centros de datos del mercado negro de chips contrabandeados son un "callejón sin salida" Research Google integra el uso de computadora de forma nativa en Gemini 3.5 Flash para automatización de agentes Research Google OpenRL: API auto-hospedada Kubernetes para post-entrenamiento de LLM; desacopla RL de infraestructura Market Micron Q3 supera expectativas con márgenes DRAM de récord; suministro de HBM totalmente asignado hasta 2026 Policy EE.UU. asegura los Países Bajos para alianéa de chips Pax Silica; tensiones ASML persisten sobre restricciones de exportación de la Ley MATCH Chips OpenAI & Broadcom revelan Jalapeño: Chip de inferencia LLM personalizado apunta a despliegue a escala de gigavatio para finales de 2026 Breaking Gemini 3.5 Flash agrega computer use nativo; framework de agente ahora predeterminado en Search Research La IA diseña rápidamente chips de radiofrecuencia novedosos más allá de la intuición humana, reduciendo años de trabajo a horas Chips El supercomputador LineShine de China encabeza el TOP500 con 2.198 exaflops solo con CPU, terminando el reinado de El Capitan de EE. UU. Market Las acciones de Cerebras se desploman 17% después de error de orientación de margen, CEO dice que la advertencia fue 'malinterpretada' Market Sunrun, Tesla y Renew Home forman planta de energía virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi rediseñado, planificando lanzamiento de servicio pagado a finales de 2026 Funding XCures cierra ronda Series B de $46M con valoración post-dinero de $127M Funding Qualcomm adquiere Modular por ~$4B para fortalecer stack de software de IA y operación de data center Chips OpenAI y Broadcom revelan Jalapeño, chip de inferencia LLM personalizado con ciclo de diseño de 9 meses Market Micron reporta ingresos Q3 de $41,5 mil millones, guía $50 mil millones para Q4 en superciclo de memoria de IA Funding Qualcomm adquiere Modular por ~$4B para construir stack de IA agnóstico de hardware contra CUDA de NVIDIA Market AWS lanza instancias EC2 G7 con NVIDIA RTX PRO 4500 Blackwell; ganancias de inferencia de 4.6x Chips Qualcomm revela CPU Dragonfly C1000 para data center; Meta se compromete con volúmenes de producción en 2028 Chips OpenAI revela chip Jalapeño para inferencia con Broadcom, objetivo de implementación a finales de 2026 Breaking Huang dice a los accionistas que los centros de datos del mercado negro de chips contrabandeados son un "callejón sin salida" Research Google integra el uso de computadora de forma nativa en Gemini 3.5 Flash para automatización de agentes Research Google OpenRL: API auto-hospedada Kubernetes para post-entrenamiento de LLM; desacopla RL de infraestructura Market Micron Q3 supera expectativas con márgenes DRAM de récord; suministro de HBM totalmente asignado hasta 2026 Policy EE.UU. asegura los Países Bajos para alianéa de chips Pax Silica; tensiones ASML persisten sobre restricciones de exportación de la Ley MATCH Chips OpenAI & Broadcom revelan Jalapeño: Chip de inferencia LLM personalizado apunta a despliegue a escala de gigavatio para finales de 2026 Breaking Gemini 3.5 Flash agrega computer use nativo; framework de agente ahora predeterminado en Search Research La IA diseña rápidamente chips de radiofrecuencia novedosos más allá de la intuición humana, reduciendo años de trabajo a horas Chips El supercomputador LineShine de China encabeza el TOP500 con 2.198 exaflops solo con CPU, terminando el reinado de El Capitan de EE. UU. Market Las acciones de Cerebras se desploman 17% después de error de orientación de margen, CEO dice que la advertencia fue 'malinterpretada' Market Sunrun, Tesla y Renew Home forman planta de energía virtual de 16GW para data centers de IA; RUN +31% Breaking Amazon Zoox revela robotaxi rediseñado, planificando lanzamiento de servicio pagado a finales de 2026 Funding XCures cierra ronda Series B de $46M con valoración post-dinero de $127M Funding Qualcomm adquiere Modular por ~$4B para fortalecer stack de software de IA y operación de data center Chips OpenAI y Broadcom revelan Jalapeño, chip de inferencia LLM personalizado con ciclo de diseño de 9 meses
Market

AWS lanza instancias EC2 G7 con NVIDIA RTX PRO 4500 Blackwell; ganancias de inferencia de 4.6x

Amazon Web Services anunció la disponibilidad general de instancias EC2 G7 alimentadas por GPUs NVIDIA RTX PRO 4500 Blackwell Server Edition el 18 de junio de 2026. G7 es el primer tipo de instancia de nube pública en presentar la GPU del servidor de la generación Blackwell, ofreciendo hasta 4.6x de rendimiento de inferencia de IA y hasta 2.1x de rendimiento de gráficos en comparación con instancias G6 de generación anterior. Las instancias admiten hasta 8 GPU por nodo con 32 GB de memoria por GPU, para un total de 256 GB de memoria de GPU, emparejadas con procesadores Intel Xeon Scalable de 6ª generación personalizados, hasta 700 Gbps de redes EFA (7x versus G6) y hasta 7.6 TB de almacenamiento NVMe SSD.

G7 viene en 7 tamaños que admiten hasta 192 vCPU y está optimizado para cargas de trabajo de inferencia de IA (traducción de idiomas, análisis de video/imagen, reconocimiento de voz, sistemas de recomendación), renderizado de gráficos profesionales, VDI y análisis acelerado por GPU en Amazon EMR. AWS logró el estado NVIDIA Exemplar Cloud en cargas de trabajo de entrenamiento NVIDIA GB300, confirmando que la infraestructura AWS cumple con los umbrales de desempeño de referencia de NVIDIA. Las instancias G7 están disponibles en US East (Ohio) y US West (Oregon) con planes para expansión regional y se pueden comprar a través de opciones On-Demand, Savings Plans y Spot.

El lanzamiento refleja la demanda de hiperscaler de capacidad GPU escalada: G7 proporciona indexación de vectores más rápida (hasta 10x más rápida a 1/4 del costo versus OpenSearch solo CPU a través de NVIDIA cuVS), comunicación multi-GPU de baja latencia a través de GPUDirect P2P y RDMA, y el ancho de banda de red requerido para inferencia distribuida. La combinación de computación Blackwell, memoria de ancho de banda alto (2.45x versus G6) e interconexiones optimizadas apunta a la implementación de IA a escala de producción donde la latencia, el rendimiento y el costo por inferencia impulsan las decisiones arquitectónicas.

Para arquitectos en la nube que implementan inferencia a escala, G7 valida el cronograma Blackwell de Nvidia en manos del cliente y señala una carrera ajustada en costo por inferencia: Jalapeño de OpenAI/Broadcom y Dragonfly de Qualcomm apuntan a ganancias de eficiencia similares, pero la disponibilidad inmediata de G7, la escala de AWS y la madurez de Blackwell ofrecen a los hiperscalers una línea de base confiable. Monitoree las curvas de adopción de G7 y las ganancias de desempeño de búsqueda de vectores como indicadores de si las GPU en la nube de propósito general permanecen competitivas en costo por inferencia con ASIC personalizados para inferencia de alto volumen.

Fuentes