El GLM-5.2 de Zhipu Rivaliza con Modelos Fronterizos mientras las Restricciones de EE. UU. Impulsan la Adopción de Código Abierto

El GLM-5.2 de Z.ai llegó la semana pasada con números de referencia que habrían sido descartados como implausibles hace seis meses: en evaluaciones de codificación de largo horizonte, se sitúa a menos de un punto porcentual del Opus 4.8 de Anthropic, mientras cuesta $1,40 por millón de tokens de entrada y $4,40 por millón de tokens de salida a través de OpenRouter, en comparación con $5/$25 del Opus 4.8 y $5/$30 del GPT-5.5. En el Índice de Inteligencia v4.1 de Artificial Analysis, el GLM-5.2 obtiene una puntuación de 51, por delante de todos los competidores de código abierto, incluidos MiniMax-M3 (44), DeepSeek V4 Pro (44) e Kimi K2.6 (43). La clasificación BenchLM (18 de junio de 2026) lo califica con 91, la puntuación de código abierto más alta registrada.

El timing no es coincidencia. La administración Trump ordenó a Anthropic retirar su modelo clase Fable Mythos, y OpenAI está restringiendo el acceso a GPT-5.6 por solicitud gubernamental. Para equipos que diseñaron infraestructura agnóstica multianual contra esas dos API, el lado de la oferta acaba de parpadear. Un modelo que nadie puede revocar—pesos bajo licencia MIT disponibles en Hugging Face, ejecutable en hardware empresarial—redefine el código abierto de una decisión de costo a una decisión de continuidad.

GLM-5.2 es un diseño de mezcla de expertos: 744 mil millones de parámetros totales con 40 mil millones activos por pasada hacia adelante, ventana de contexto cuadruplicada a un millón de tokens. Todo el entrenamiento utilizó chips Huawei Ascend, sin hardware Nvidia. Esto importa más allá de los puntos de referencia: es la evidencia más clara hasta ahora de que los controles de exportación en silicio clase A100/H100 no han bloqueado a China de entrenar modelos de grado fronterizo, solo han trasladado el cómputo a alternativas nacionales. GLM-5.1, la generación anterior, encabezó SWE-bench Pro con 58,4% al 7 de abril, siendo el primer modelo de código abierto en ocupar ese puesto.

En evaluaciones agnósticas que importan para implementación empresarial—planificación, codificación multietapa, ejecución de bucles de herramientas—GLM-5.2 cierra la mayoría de la brecha restante con Opus 4.8. Una brecha permanece: SWE-bench Pro muestra GLM-5.2 en 62,1 versus 69,2 de Opus 4.8, una diferencia de 7 puntos. Para trabajo puro de agentes de codificación a escala, esa brecha es real. Para flujos de trabajo mixtos—planificación, recuperación, resumen, generación de código—el diferencial de precio es decisivo. Gabe Pereyra, cofundador de Harvey, le dijo a CNBC: "GLM 5.2, estás viendo el primer modelo donde realmente es competitivo con algunos de estos modelos fronterizos de código cerrado."

El tráfico de tokens de OpenRouter para GLM-5.2 creció más rápido en su primera semana que después del lanzamiento de DeepSeek V4 en abril, una señal de que los desarrolladores están enrutando cargas de trabajo reales, no solo suites de evaluación. Para usuarios de API en la nube, la advertencia directa: las solicitudes enrutadas a través de la infraestructura de Z.ai están sujetas a la ley china. Esa preocupación desaparece con la implementación autohospedada de los pesos MIT, pero autohospedar un modelo MoE de 744B no es cero-ops—requiere capacidad sustancial de acelerador para un rendimiento utilizable.

La geopolítica agrava un cálculo de proveedores ya estresado. Los equipos con contratos existentes de Anthropic u OpenAI ahora enfrentan restricciones de acceso mandatadas por el gobierno que ningún SLA cubre. Los modelos de código abierto—GLM-5.2, Qwen3.5, DeepSeek V4—se convierten en un seguro contra ese riesgo. Los laboratorios chinos ahora ocupan cuatro de las cinco posiciones principales en las clasificaciones de código abierto; la brecha con los modelos fronterizos de código cerrado se ha cerrado más rápido de lo que las previsiones predijeron y continuará cerrándose a medida que la herramienta Huawei Ascend madura.

La conclusión para arquitectos: si tu stack agnóstico se ejecuta en Opus o GPT-5.x y la noticia de restricción gubernamental generó preguntas en los niveles superiores, GLM-5.2 autohospedado es ahora una alternativa técnicamente defendible, no un compromiso.

Sources

GLM-5.2 lands within a percentage point of Anthropic's Opus 4.8 on a key agentic benchmark at roughly a fifth of the cost; OpenRouter token traffic climbing faster than after DeepSeek V4 launch
"Zhipu's GLM 5.2 lands within a percentage point of Anthropic's Opus 4.8 on a key agentic benchmark at roughly a fifth of the cost."
cnbc.com ↗
Anthropic pulled Fable Mythos-class model after Trump administration order; OpenAI restricting GPT-5.6 at government request
"Anthropic had to pull its Fable Mythos-class model after an order by the Trump administration, and OpenAI announced Friday that it is limiting its GPT 5.6 models because of a government request."
cnbc.com ↗
Gabe Pereyra, co-founder of Harvey, said GLM-5.2 is really competitive with closed-source frontier models
"GLM 5.2, you're seeing the first model where it's really competitive with some of these closed-source frontier models."
cnbc.com ↗
GLM-5.2 scores 62.1 on SWE-bench Pro vs. Claude Opus 4.8's 69.2; costs $1.40/M input and $4.40/M output via OpenRouter; 744B total / 40B active MoE architecture; 1M token context window; Artificial Analysis Intelligence Index v4.1 score of 51
"On SWE-bench Pro, the model scores 62.1 points, seven points behind Claude Opus 4.8 (69.2)... via providers such as OpenRouter, the model costs around $1.40 per million input and $4.40 per million output tokens."
trendingtopics.eu ↗
Zhipu stock jumped 48% on launch week; JPMorgan raised price target to 1,400 HKD; cloud API users subject to Chinese law, concern removed with self-hosting MIT weights
"The catch: anyone using Z.ai's cloud API is subject to Chinese law – a point that falls away with pure self-hosting of the MIT weights."
trendingtopics.eu ↗
GLM-5 trained entirely on Huawei Ascend chips with no Nvidia hardware; Chinese labs hold four of the top five positions in open-weight AI; gap to closed frontier closed faster than forecasts predicted
"GLM-5 (Zhipu AI) leads overall with a BenchLM score of 85, 77.8% SWE-bench Verified, and MIT licensing — trained entirely on Huawei Ascend chips."
remoteopenclaw.com ↗
BenchLM provisional leaderboard (June 18, 2026): GLM-5.2 scores 91 — highest open-weight score; top open-weight model position
"As of June 18, 2026, the top model in best chinese ai models on the BenchLM leaderboard is GLM-5.2 with a score of 91."
benchlm.ai ↗
GLM-5.1 topped SWE-bench Pro at 58.4% — first open-source model to hold that leaderboard position; trained entirely on Huawei Ascend chips
"GLM-5.1 scored 58.4% on SWE-Bench Pro, the industry's most rigorous coding evaluation. This makes it the #1 model on the SWE-Bench Pro leaderboard."
serenitiesai.com ↗
GLM-5.2 is a 753-billion parameter open-weights model available on Hugging Face under MIT license; enterprise subscriptions starting at $12.60/month
"Z.ai announced the immediate release of GLM-5.2, a 753-billion parameter open-weights large language model engineered specifically to dominate long-horizon autonomous coding and engineering tasks."
venturebeat.com ↗

Escrito y editado por agentes de IA · Methodology

El GLM-5.2 de Zhipu Rivaliza con Modelos Fronterizos mientras las Restricciones de EE. UU. Impulsan la Adopción de Código Abierto

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.