Research sábado, 27 de junio de 2026, 04:04

Zhipu GLM 5.2 cierra brecha con Claude Opus 4.8; open-weight coding entra en tier frontier

GLM 5.2 de Zhipu AI, lanzado el 13 de junio y clasificado el 16 de junio, es el primer modelo open-weight que genuinamente compite con agentes de codificación propietarios frontier. En Terminal-Bench 2.1, GLM 5.2 marca 81.0, quedando atrás de Claude Opus 4.8 por solo unos pocos puntos (85.0); en SWE-Bench Pro alcanza 62.1, adelante de GPT-5.5 (58.6) y dentro del alcance de Opus 4.8. El modelo Mixture-of-Experts de 753 mil millones de parámetros incluye pesos licenciados MIT distribuidos vía HuggingFace, ventana de contexto de 1 millón de tokens y salida máxima de 131.072 tokens—todo ejecutable localmente en hardware de consumidor con cuantización.

El modelo mejora drámaticamente sobre GLM 5.1 (62.0 → 81.0 en Terminal-Bench) a través de refinamientos arquitectónicos incluyendo IndexShare (reduciendo FLOPs por-token en 2.9× en contexto 1M) y mejoras de capa MTP. Precio es agresivo: $1.40 entrada / $4.40 salida por millón de tokens vía API Fireworks (aproximadamente una sexta parte del costo combinado de GPT-5.5 en $35), o planes de suscripción de tarifa fija para usuarios power. Desarrolladores reportan que GLM 5.2 supera a Opus 4.8 en algunos benchmarks agentic (Design Arena, MCP-Atlas) mientras lo iguala en tareas de codificación long-horizon.

Para ingenieros entregando agentes autónomos y generación de código a escala, GLM 5.2 elimina el trade-off entre costo y capacidad. Licencia open-weight elimina restricciones de despliegue; hospedaje multi-nube y cuantización permiten ejecuciones en las instalaciones para cargas de trabajo reguladas. Este cambio señala que modelos abiertos ya no son un segundo distante—ahora fuerzan conversaciones de precio y decisiones arquitectónicas en torno a residencia de datos, IP y margen de inference para equipos construyendo sistemas de AI de producción.

Fuentes

Primary source
avenchat.com
“GLM 5.2 scores 81.0 on Terminal-Bench 2.1, landing within a few points of Claude Opus 4.8 (85.0) and ahead of the rest of the open-weight field. On SWE-bench Pro (62.1), it edges ahead of GPT-5.5 (~58.6) and is within striking range of Opus 4.8.”
kie.ai
“GLM-5.2 was released on June 13, 2026 by Z.ai (formerly Zhipu AI). Fireworks lists GLM-5.2 as 743B-parameter Mixture-of-Experts model with a 1,040K context window and 131,072-token max output. The model is MIT-licensed open weights at $1.40/$4.40 per 1M tokens.”
codersera.com
“GLM 5.2 (Z.ai, June 13 2026) ships a 1M-token context window plus MIT-licensed open weights. Pick GLM 5.2 for cost-controlled, self-hostable, repo-scale agents. Claude Opus 4.8 remains the agentic-coding benchmark at premium per-token pricing.”

Zhipu GLM 5.2 cierra brecha con Claude Opus 4.8; open-weight coding entra en tier frontier

Fuentes

Recibe la señal antes del ruido.