EN VIVO · SÁB, 27 JUN 2026 --:--:-- ET
Edición Nº 67 GASTO TOTAL $14570.18 ARTÍCULOS HOY 4 TOKENS TOTAL 9.17B
aiexpert
En vivo
Research Zhipu GLM 5.2 cierra brecha con Claude Opus 4.8; open-weight coding entra en tier frontier Chips Cerebras y OpenAI firman acuerdo de $20B+ para despliegue de capacidad de inferencia de IA de alta velocidad de 750MW Funding Mirendil levanta $200M seed a $1B: ex-investigadores de Anthropic construyen IA para IA R&D Market Mega-caps de tecnología pierden $2.7T en junio conforme suben preocupaciones sobre capex de IA Breaking Vercel lanza Eve, framework de código abierto para construir agentes de IA en producción Breaking Admin Trump otorga licencia de exportación a Anthropic para Mythos 5, cerrando estancamiento de 2 semanas Funding Groq levanta $650M, pivota a neocloud de inferencia tras acuerdo de licencia de $20B de Nvidia Chips Apple lanza container 1.0: runtime OCI nativo para Linux en Apple silicon, alternativa gratuita a Docker Desktop Breaking OpenAI lanza serie GPT-5.6 (Sol, Terra, Luna) en vista previa gubernamental; Sol a $5/$30 por millón de tokens Breaking Zhipu GLM 5.2 se ubica a un porcentaje del Opus 4.8 de Anthropic a una quinta parte del costo Funding Upscale AI alcanza valuación de $2B con extensión de Series A de $190M; Nvidia respalda startup de chip de networking de IA Funding Mirendil levanta $200M seed a $1B para automatizar investigación de IA de frontera Funding General Intuition levanta $320M a $2,3B para entrenar agentes en datos de acción de gameplay Funding Baseten cierra Serie F de $1,5B a valuación de $13B; consolidación de inferencia de IA Funding AppsFlyer recauda $1B de Google, Meta, Unity; medición de anuncios independiente apuesta en IA Market Oracle se desploma 19% en la peor semana desde 2001; carga de deuda de $130B dispara reevaluación Funding Baseten cierra Series F de $1,5B con valoración de $13B, crecimiento de ingresos 20x Market La acción de Meta cae por preocupaciones de capex; gasto de $125–145B en 2026 no logra mover inversores Chips GlobalPlatform lanza Pavona: silicio abierto con criptografía post-cuántica de grado productivo Breaking Vercel lanza Eve, framework de agente de código abierto con ejecución durable y sandboxing integrados Research Zhipu GLM 5.2 cierra brecha con Claude Opus 4.8; open-weight coding entra en tier frontier Chips Cerebras y OpenAI firman acuerdo de $20B+ para despliegue de capacidad de inferencia de IA de alta velocidad de 750MW Funding Mirendil levanta $200M seed a $1B: ex-investigadores de Anthropic construyen IA para IA R&D Market Mega-caps de tecnología pierden $2.7T en junio conforme suben preocupaciones sobre capex de IA Breaking Vercel lanza Eve, framework de código abierto para construir agentes de IA en producción Breaking Admin Trump otorga licencia de exportación a Anthropic para Mythos 5, cerrando estancamiento de 2 semanas Funding Groq levanta $650M, pivota a neocloud de inferencia tras acuerdo de licencia de $20B de Nvidia Chips Apple lanza container 1.0: runtime OCI nativo para Linux en Apple silicon, alternativa gratuita a Docker Desktop Breaking OpenAI lanza serie GPT-5.6 (Sol, Terra, Luna) en vista previa gubernamental; Sol a $5/$30 por millón de tokens Breaking Zhipu GLM 5.2 se ubica a un porcentaje del Opus 4.8 de Anthropic a una quinta parte del costo Funding Upscale AI alcanza valuación de $2B con extensión de Series A de $190M; Nvidia respalda startup de chip de networking de IA Funding Mirendil levanta $200M seed a $1B para automatizar investigación de IA de frontera Funding General Intuition levanta $320M a $2,3B para entrenar agentes en datos de acción de gameplay Funding Baseten cierra Serie F de $1,5B a valuación de $13B; consolidación de inferencia de IA Funding AppsFlyer recauda $1B de Google, Meta, Unity; medición de anuncios independiente apuesta en IA Market Oracle se desploma 19% en la peor semana desde 2001; carga de deuda de $130B dispara reevaluación Funding Baseten cierra Series F de $1,5B con valoración de $13B, crecimiento de ingresos 20x Market La acción de Meta cae por preocupaciones de capex; gasto de $125–145B en 2026 no logra mover inversores Chips GlobalPlatform lanza Pavona: silicio abierto con criptografía post-cuántica de grado productivo Breaking Vercel lanza Eve, framework de agente de código abierto con ejecución durable y sandboxing integrados
Chips

Cerebras y OpenAI firman acuerdo de $20B+ para despliegue de capacidad de inferencia de IA de alta velocidad de 750MW

Cerebras Systems y OpenAI anunciaron un acuerdo multi-año el 23 de junio para que OpenAI despliegue 750 megavars de computación de inferencia wafer-scale de Cerebras durante los próximos años. El acuerdo se valora en más de $20 mil millones, con despliegue comenzando en 2026. Este es el despliegue de inferencia de IA de alta velocidad más grande anunciado hasta la fecha y refleja un giro estratégico hacia silício de inferencia dedicada de baja latencia—diferente de la infraestructura de entrenamiento centrada en GPU que ha dominado el capex de IA.

<cite index="42-2">OpenAI afirma que "Cerebras añade una solución de inferencia dedicada de baja latencia a nuestra plataforma. Eso significa respuestas más rápidas, interacciones más naturales y una base más sólida para escalar IA en tiempo real a muchas más personas."</cite> <cite index="44-2">Cerebras lanzó simultáneamente una asociación multi-año con AWS que trae una estrategia de inferencia desagregada: los chips Trainium 3 de AWS realizan el prefill, y CS-3 de Cerebras ejecuta inferencia de velocidad relampagueante para decodificación.</cite> Este enfoque de dos proveedores subraya que OpenAI y AWS están desacoplando generación de tokens de codificación de contexto.

<cite index="44-2">Cerebras co-lanzó Codex-Spark, un modelo diseñado para codificación casi instantánea y optimizado para trabajo interactivo donde importa la latencia, entregando más de 1.000 tokens por segundo.</cite> <cite index="44-2">Kimi K2.6, el modelo de peso abierto líder y el primer modelo de billones de parámetros servido en Cerebras, logró un desempeño cercano a 1.000 tokens por segundo como medido independientemente por Análisis Artificial.</cite> Estos puntos de referencia validan el silício wafer-scale para cargas de trabajo agentic sensibles a la latencia.

Para profesionales, este acuerdo señala una inversión estratégica en infraestructura de IA: el entrenamiento fue el recurso escaso en 2023-2024; la inferencia ahora es la restricción. <cite index="47-2">El acuerdo de despliegue de 750MW es aproximadamente 23 veces el punto medio de la guía de ingresos de año completo de 2026 de Cerebras</cite>, dando a la empresa claridad de ingresos contratados rara entre proveedores de hardware. El compromiso de OpenAI de $20 mil millones+ también valida que los proveedores de modelos de frontera mantendrán tiers de inferencia dedicados separados de ofertas de commodities de hiperscala. Espere más anuncios de capacidad de fábrica de competidores (Groq, CoreWeave, otros) y más anuncios de co-optimización hardware-software a medida que las velocidades de inferencia se conviertan en un diferenciador de producto visible para agentes de IA en tiempo real.

Fuentes