Zhipu GLM 5.2 fecha lacuna com Claude Opus 4.8; open-weight coding entra em tier frontier
GLM 5.2 da Zhipu AI, lançado em 13 de junho e classificado em 16 de junho, é o primeiro modelo open-weight a genuinamente competir com agentes de codificação proprietários frontier. Em Terminal-Bench 2.1, GLM 5.2 marca 81.0, ficando atrás de Claude Opus 4.8 por apenas alguns pontos (85.0); em SWE-Bench Pro atinge 62.1, à frente de GPT-5.5 (58.6) e dentro do alcance de Opus 4.8. O modelo Mistura-de-Especialistas de 753 bilhões de parâmetros inclui pesos licenciados MIT distribuídos via HuggingFace, janela de contexto de 1 milhão de tokens e saída máxima de 131.072 tokens—todos executáveis localmente em hardware de consumidor com quantização.
O modelo melhora dramaticamente sobre GLM 5.1 (62.0 → 81.0 em Terminal-Bench) através de refinamentos de arquitetura incluindo IndexShare (reduzindo FLOPs por-token em 2.9× em contexto 1M) e melhorias camada MTP. Preço é agressivo: $1.40 entrada / $4.40 saída por milhão de tokens via API Fireworks (aproximadamente um sexto do custo combinado de GPT-5.5 em $35), ou planos de subscrição taxa-fixa para usuários power. Desenvolvedores reportam GLM 5.2 supera Opus 4.8 em alguns benchmarks agentic (Design Arena, MCP-Atlas) enquanto o emparelha em tarefas de codificação long-horizon.
Para engenheiros entregando agentes autônomos e geração de código em escala, GLM 5.2 remove a troca entre custo e capacidade. Licenciamento open-weight elimina restrições de implantação; hospedagem multi-nuvem e quantização permitem execuções no local para cargas de trabalho reguladas. Este deslocamento sinaliza que modelos abertos não são mais um segundo distante—agora forçam conversás de preço e decisões arquiteturáis em torno de residência de dados, IP e margem de inference para times construindo sistemas de AI de produção.
Fontes
- Primary source
- avenchat.com
“GLM 5.2 scores 81.0 on Terminal-Bench 2.1, landing within a few points of Claude Opus 4.8 (85.0) and ahead of the rest of the open-weight field. On SWE-bench Pro (62.1), it edges ahead of GPT-5.5 (~58.6) and is within striking range of Opus 4.8.”
- kie.ai
“GLM-5.2 was released on June 13, 2026 by Z.ai (formerly Zhipu AI). Fireworks lists GLM-5.2 as 743B-parameter Mixture-of-Experts model with a 1,040K context window and 131,072-token max output. The model is MIT-licensed open weights at $1.40/$4.40 per 1M tokens.”
- codersera.com
“GLM 5.2 (Z.ai, June 13 2026) ships a 1M-token context window plus MIT-licensed open weights. Pick GLM 5.2 for cost-controlled, self-hostable, repo-scale agents. Claude Opus 4.8 remains the agentic-coding benchmark at premium per-token pricing.”