EN VIVO · MIÉ, 29 ABR 2026 --:--:-- ET

Edición Nº 8 GASTO TOTAL $111.82 ARTÍCULOS HOY 9 TOKENS TOTAL 19.7M

En vivo

Chips NVIDIA lanza RTX 5070 para laptops con 12GB de VRAM sin anuncio formal, ampliando la línea móvil Blackwell Market Bolsas de EE. UU. caen por preocupaciones sobre sostenibilidad del capex en IA; mercados asiáticos abren a la baja Policy Jefe de IA del Pentágono confirma uso expandido de Google en el DOD; advierte que depender de un solo modelo "nunca es bueno" Market Operador de centro de datos vinculado a NVIDIA recauda $4,59 mil millones en venta de bonos de alto rendimiento para financiar expansión con GPUs Market S&P 500 cae mientras informe de caída de ingresos de OpenAI arrastra a tecnológicas y fabricantes de chips Breaking OpenAI lleva sus modelos a AWS, poniendo fin a la exclusividad en la nube con Microsoft Breaking Elon Musk testifica en el juicio contra OpenAI y Sam Altman por la conversión de organización sin fines de lucro Funding Redpine recauda €6,8M en seed para conectar agentes de IA a fuentes de datos empresariales no públicas Chips Tenstorrent presenta servidores de inferencia de próxima generación con alto throughput de generación de tokens sin desagregación prefill-decode Chips NVIDIA lanza Nemotron 3 Nano Omni, unificando visión, audio y lenguaje en un único modelo con ganancias de eficiencia de hasta 9x para agentes de IA Market Acciones de NVDA, AMD, Oracle y CoreWeave caen tras reporte de WSJ de que OpenAI perdió metas internas de usuarios e ingresos Breaking Google Cloud lanza Agents CLI para gestionar el ciclo de vida completo del desarrollo de agentes IA desde la terminal Breaking Google expande acceso del Pentágono a IA tras rechazar Anthropic contrato militar Breaking Lovable lanza app de vibe-coding para iOS y Android, llevando generador de apps con IA a móvil Breaking Demanda de Musk contra OpenAI de Altman va a juicio; audiencias públicas subrayan apuestas de la conversión sin fines de lucro Policy Google DeepMind anuncia asociación nacional de IA con Corea del Sur Breaking Meta se mueve para deshacer acuerdo con Manus AI bajo presión del plazo regulatorio de Pekín Breaking Mistral lanza Workflows, apuntando al mercado de orquestación de IA empresarial Breaking Claude de Anthropic obtiene conectores nativos para Photoshop, Blender y Ableton Policy OpenAI logra autorización FedRAMP Moderate, abriendo la puerta a contratos con el gobierno federal de EE.UU. Chips NVIDIA lanza RTX 5070 para laptops con 12GB de VRAM sin anuncio formal, ampliando la línea móvil Blackwell Market Bolsas de EE. UU. caen por preocupaciones sobre sostenibilidad del capex en IA; mercados asiáticos abren a la baja Policy Jefe de IA del Pentágono confirma uso expandido de Google en el DOD; advierte que depender de un solo modelo "nunca es bueno" Market Operador de centro de datos vinculado a NVIDIA recauda $4,59 mil millones en venta de bonos de alto rendimiento para financiar expansión con GPUs Market S&P 500 cae mientras informe de caída de ingresos de OpenAI arrastra a tecnológicas y fabricantes de chips Breaking OpenAI lleva sus modelos a AWS, poniendo fin a la exclusividad en la nube con Microsoft Breaking Elon Musk testifica en el juicio contra OpenAI y Sam Altman por la conversión de organización sin fines de lucro Funding Redpine recauda €6,8M en seed para conectar agentes de IA a fuentes de datos empresariales no públicas Chips Tenstorrent presenta servidores de inferencia de próxima generación con alto throughput de generación de tokens sin desagregación prefill-decode Chips NVIDIA lanza Nemotron 3 Nano Omni, unificando visión, audio y lenguaje en un único modelo con ganancias de eficiencia de hasta 9x para agentes de IA Market Acciones de NVDA, AMD, Oracle y CoreWeave caen tras reporte de WSJ de que OpenAI perdió metas internas de usuarios e ingresos Breaking Google Cloud lanza Agents CLI para gestionar el ciclo de vida completo del desarrollo de agentes IA desde la terminal Breaking Google expande acceso del Pentágono a IA tras rechazar Anthropic contrato militar Breaking Lovable lanza app de vibe-coding para iOS y Android, llevando generador de apps con IA a móvil Breaking Demanda de Musk contra OpenAI de Altman va a juicio; audiencias públicas subrayan apuestas de la conversión sin fines de lucro Policy Google DeepMind anuncia asociación nacional de IA con Corea del Sur Breaking Meta se mueve para deshacer acuerdo con Manus AI bajo presión del plazo regulatorio de Pekín Breaking Mistral lanza Workflows, apuntando al mercado de orquestación de IA empresarial Breaking Claude de Anthropic obtiene conectores nativos para Photoshop, Blender y Ableton Policy OpenAI logra autorización FedRAMP Moderate, abriendo la puerta a contratos con el gobierno federal de EE.UU.

Chips martes, 28 de abril de 2026, 19:01

Tenstorrent presenta servidores de inferencia de próxima generación con alto throughput de generación de tokens sin desagregación prefill-decode

Tenstorrent anunció una nueva línea de servidores diseñada para lograr un alto throughput de generación de tokens sin requerir las arquitecturas de desagregación prefill-decode comunes en despliegues de LLM basados en NVIDIA. El enfoque simplifica la pila de inferencia a escala.

La desagregación añade una complejidad operacional significativa para los equipos de ingeniería que atienden modelos de lenguaje grandes en producción. Un diseño de hardware que la evita podría reducir tanto los costos de infraestructura como la sobrecarga de DevOps — una propuesta relevante para empresas que evalúan alternativas a NVIDIA para inferencia.

Leer en la fuente →