EN VIVO · LUN, 25 MAY 2026 --:--:-- ET
Edición Nº 34 GASTO TOTAL $11566.54 ARTÍCULOS HOY 8 TOKENS TOTAL 6.76B
aiexpert
En vivo
Breaking Microsoft abre código fuente MDASH para investigación de vulnerabilidades de IA a escala Breaking OpenAI se asocia estratégicamente con Grupo Folha y Grupo UOL; expansión en medios brasileiros Chips Imec fabrica primer qubit de punto cuántico usando litografía EUV de alta apertura numérica Chips Fabricante chino de GPUs agota 30 mil unidades de LX 7G100 en 48 horas Research Gemma 4 Multi-Token Prediction Entrega hasta 3x Generación Más Rápida de Tokens Funding Inversores Más Activos en Legaltech en Europa Identificados en Nuevo Análisis de Sifted Policy Impulso de Soberanía Europea Enfrenta Preocupaciones sobre Bienestar Corporativo en Financiamiento de IA Market Repunte de IA Alcanza Máximo Histórico en Acciones de Momentum Global Breaking Google Introduce Arquitectura de Middleware para Aplicaciones Genkit Breaking Supermicro enfrenta escándalo de contrabando de $2,5 mil millones; CEO de Nvidia pide rigor en controles de exportación Chips AMD RX 9070 XT Advanced Shader Delivery: hasta 95% más rápido en tiempos de carga en pruebas Chips Investigador desarrolla revestimiento de sigilo aplicable por spray para drones con reducción de radar de 43dB Breaking Servidor AWS MCP alcanza disponibilidad general con cobertura completa de API y gobernanza IAM Breaking Microsoft abre código fuente MDASH para investigación de vulnerabilidades de IA a escala Breaking OpenAI se asocia estratégicamente con Grupo Folha y Grupo UOL; expansión en medios brasileiros Chips Imec fabrica primer qubit de punto cuántico usando litografía EUV de alta apertura numérica Chips Fabricante chino de GPUs agota 30 mil unidades de LX 7G100 en 48 horas Research Gemma 4 Multi-Token Prediction Entrega hasta 3x Generación Más Rápida de Tokens Funding Inversores Más Activos en Legaltech en Europa Identificados en Nuevo Análisis de Sifted Policy Impulso de Soberanía Europea Enfrenta Preocupaciones sobre Bienestar Corporativo en Financiamiento de IA Market Repunte de IA Alcanza Máximo Histórico en Acciones de Momentum Global Breaking Google Introduce Arquitectura de Middleware para Aplicaciones Genkit Breaking Supermicro enfrenta escándalo de contrabando de $2,5 mil millones; CEO de Nvidia pide rigor en controles de exportación Chips AMD RX 9070 XT Advanced Shader Delivery: hasta 95% más rápido en tiempos de carga en pruebas Chips Investigador desarrolla revestimiento de sigilo aplicable por spray para drones con reducción de radar de 43dB Breaking Servidor AWS MCP alcanza disponibilidad general con cobertura completa de API y gobernanza IAM
Research

Gemma 4 Multi-Token Prediction Entrega hasta 3x Generación Más Rápida de Tokens

Gemma 4 de Google introduce capacidad de predicción multi-token, permitiendo que la inferencia genere hasta tres tokens por pasada hacia adelante en lugar de uno. Este enfoque reduce el número de llamadas secuenciales de modelo requeridas durante la decodificación, traduciéndose directamente en un throughput de token más rápido de extremo a extremo.

Para implementaciones en producción en tareas sensibles a la latencia (chat, búsqueda, completación de código), menos pasadas significan menor costo por token y un tiempo de reloj de pared más rápido. La técnica es solo de inferencia y no requiere fine-tuning de modelos downstream para soportarla.

Leer en la fuente →