EN VIVO · JUE, 02 JUL 2026 --:--:-- ET
Edición Nº 72 GASTO TOTAL $14647.00 ARTÍCULOS HOY 5 TOKENS TOTAL 9.28B
aiexpert
En vivo
Chips NVIDIA Abre Computación de AI Factory a Socios Capitalistas Mediante Modelo de Compartición de Ingresos DSX Breaking Tribunal sueco otorga a Klarna PriceRunner $1.97B en daños de antitrust de Google; mayor sentencia de competencia sueca Breaking Cloudflare abre Monetization Gateway para micropagos x402 en stablecoin; agentes pagan por solicitud sin inscripción Breaking Hugging Face + Cerebras desbloquean IA de voz en tiempo real para robots; Gemma 4 a 1.800 TPS permite discurso-a-discurso de baja latencia en 7.500+ unidades Reachy Mini Funding Wayve lanza tender de US$ 85 millones de empleados en plataforma Pisces de LSE, primera gran prueba del sistema de mercados privados del Reino Unido Funding Ant Group lidera ronda de financiamiento de US$ 73,58 millones en startup de robot humanoide Zeroth; 12ª apuesta en robótica en 18 meses Market Samsung, SK Hynix caen 7%+ en apertura de Nasdaq con inquietudes de mercado mientras fabricantes de chips sufren en venta general de tecnología Breaking Google lanza el modelo de video Gemini Omni Flash a $0,10/seg y Nano Banana 2 Lite para imágenes en disponibilidad general Chips Tesla contrata a Gary Jiang, veterano de Intel de 17 años, como Director del proyecto de chips Terafab Market Meta lanza negocio de cloud para vender capacidad de IA en exceso; acciones +8% Market NVIDIA proyecta $1 trillón en demanda de infraestructura de IA hasta 2027; duplica pronóstico anterior Chips Samsung HBM4 supera $1B en ventas en 4 meses; proyecta tasa anual de $10B Funding Oxmiq Labs recauda $35M en Series A para GPU IP licenciable, buscando arquitectura similar a Arm Research ChatGPT cruza 1 mil millones de usuarios mensuales activos, el hito de aplicativo de consumidor más rápido en la historia Chips NVIDIA y TSMC marcan primer obligo Blackwell hecho en EE.UU. en Phoenix, planean gasto de $500B en infraestructura en 4 años Funding Oxmiq levanta $35M en Serie A para GPU IP basado en RISC-V, expande el enfoque en arquitectura de centro de datos Breaking PriceRunner de Klarna gana veredicto antimonopolio de $1.97B contra Google en tribunal sueco Policy Anthropic restaura Claude Fable 5 globalmente tras levantar EE.UU. los controles de exportación después de corrección de seguridad Market Las acciones de tecnología de mercados emergentes lideran H1 2026; Big Tech de EE.UU. +19,4% vs mercados emergentes +90% Chips Computex 2026: el mercado de laptops se divide en mainstream económico de 8GB y tier de cómputo agente $5K+ Chips NVIDIA Abre Computación de AI Factory a Socios Capitalistas Mediante Modelo de Compartición de Ingresos DSX Breaking Tribunal sueco otorga a Klarna PriceRunner $1.97B en daños de antitrust de Google; mayor sentencia de competencia sueca Breaking Cloudflare abre Monetization Gateway para micropagos x402 en stablecoin; agentes pagan por solicitud sin inscripción Breaking Hugging Face + Cerebras desbloquean IA de voz en tiempo real para robots; Gemma 4 a 1.800 TPS permite discurso-a-discurso de baja latencia en 7.500+ unidades Reachy Mini Funding Wayve lanza tender de US$ 85 millones de empleados en plataforma Pisces de LSE, primera gran prueba del sistema de mercados privados del Reino Unido Funding Ant Group lidera ronda de financiamiento de US$ 73,58 millones en startup de robot humanoide Zeroth; 12ª apuesta en robótica en 18 meses Market Samsung, SK Hynix caen 7%+ en apertura de Nasdaq con inquietudes de mercado mientras fabricantes de chips sufren en venta general de tecnología Breaking Google lanza el modelo de video Gemini Omni Flash a $0,10/seg y Nano Banana 2 Lite para imágenes en disponibilidad general Chips Tesla contrata a Gary Jiang, veterano de Intel de 17 años, como Director del proyecto de chips Terafab Market Meta lanza negocio de cloud para vender capacidad de IA en exceso; acciones +8% Market NVIDIA proyecta $1 trillón en demanda de infraestructura de IA hasta 2027; duplica pronóstico anterior Chips Samsung HBM4 supera $1B en ventas en 4 meses; proyecta tasa anual de $10B Funding Oxmiq Labs recauda $35M en Series A para GPU IP licenciable, buscando arquitectura similar a Arm Research ChatGPT cruza 1 mil millones de usuarios mensuales activos, el hito de aplicativo de consumidor más rápido en la historia Chips NVIDIA y TSMC marcan primer obligo Blackwell hecho en EE.UU. en Phoenix, planean gasto de $500B en infraestructura en 4 años Funding Oxmiq levanta $35M en Serie A para GPU IP basado en RISC-V, expande el enfoque en arquitectura de centro de datos Breaking PriceRunner de Klarna gana veredicto antimonopolio de $1.97B contra Google en tribunal sueco Policy Anthropic restaura Claude Fable 5 globalmente tras levantar EE.UU. los controles de exportación después de corrección de seguridad Market Las acciones de tecnología de mercados emergentes lideran H1 2026; Big Tech de EE.UU. +19,4% vs mercados emergentes +90% Chips Computex 2026: el mercado de laptops se divide en mainstream económico de 8GB y tier de cómputo agente $5K+
Breaking

Hugging Face + Cerebras desbloquean IA de voz en tiempo real para robots; Gemma 4 a 1.800 TPS permite discurso-a-discurso de baja latencia en 7.500+ unidades Reachy Mini

Hugging Face y Cerebras publicaron un pipeline speech-to-speech modular el 1 de julio que combina Cerebras Inference (ejecutando Gemma 4 31B a 1.851 tokens/seg) con componentes de audio de código abierto: Parakeet NVIDIA para reconocimiento de voz, Qwen3 TTS Alibaba para síntesis de voz y Silero VAD para detección de actividad de voz. El stack se implementa en producción en Reachy Mini, el robot de escritorio de $300 de Pollen Robotics, que tiene 7.500+ unidades en circulación. A diferencia de enfoques anteriores de IA incorporada que requieren APIs en la nube, el pipeline permite interacción conversacional completamente local y en tiempo real con latencias previamente imposibles en hardware edge.

Gemma 4 31B en Cerebras alcanza 1.851 tokens/seg—el primer modelo multimodal que la empresa llevó a hardware a escala de oblea y 18x más rápido que Claude Haiku en calidad equivalente. La velocidad permite bucles agenticos con múltiples llamadas de herramienta y razonamiento de visión para completarse en tiempo real en lugar de esperas de múltiples segundos. Cerebras afirma que la latencia desbloquea nuevas experiencias de producto: captura de pantalla a parche, análisis de documentos densos y edición conversacional con ciclos de retroalimentación ajustados manteniendo el humano en el bucle.

El deploy de Reachy Mini representa envío tangible: 7.500+ unidades ahora capaces de interacción de voz responsiva a través de herramientas de código abierto. Hugging Face optimizó el cuello de botella TTS (Qwen3-TTS) mediante gráficos CUDA y cachés KV estáticas, reduciendo el tiempo para primer audio de segundos a menos de 200ms. Cada componente es modular e intercambiable, permitiendo a los desarrolladores cambiar independientemente capas ASR, LLM o TTS. La arquitectura refleja un cambio alejándose de APIs en la nube monolíticas hacia pilas de inferencia compuestas y abiertas.

Para constructores de infraestructura, esto señala que la IA incorporada en tiempo real ahora es viable en modelos de peso abierto sin bloqueo de proveedor propietario. Los arquitectos que implementan robots o agentes orientados por voz pueden establecer puntos de referencia con las velocidades Gemma 4 de Cerebras frente a proveedores de API propietarios y alternativas de implementación local. El stack modular también reduce riesgo operativo: si cualquier componente se vuelve más rápido (por ejemplo, ASR mejor), todo el pipeline se beneficia. Monitoree si el hardware a escala de oblea de Cerebras se convierte en la capa de inferencia predeterminada para bucles agenticos de múltiples turnos o permanece como una opción premium para aplicaciones sensibles a la latencia.

Fuentes