GLM-5.2 da startup chinesa Z.ai bate GPT-5.5 em codificação a 1/6 do custo
Z.ai (anteriormente Zhipu AI), uma startup baseada em Pequim, lançou GLM-5.2, um modelo de código aberto com 753 bilhões de parâmetros que exibe desempenho superior ao GPT-5.5 em vários benchmarks de codificação de longo horizonte enquanto custa aproximadamente um sexto. Em SWE-bench Pro, GLM-5.2 marcou 62,1 versus 58,6 do GPT-5.5; em FrontierSWE (simulando tarefas de engenharia de horas), atingiu 74,4% versus 72,6% do GPT-5.5. No leaderboard crowdsourced da Design Arena, GLM-5.2 ficou em #1 com Elo de 1360, vencendo Claude Fable 5. O modelo custa $1,40 entrada / $4,40 saída por milhão de tokens versus $5 entrada / $30 saída do GPT-5.5.
GLM-5.2 estende um contexto estável de 1 milhão de tokens e introduz IndexShare, uma técnica de atenção esparsa que reutiliza índices em camadas de transformadores para reduzir o cálculo por token em 2,9x em janelas de contexto longo. É liberado sob uma licença MIT irrestrita, permitindo que empresas baixem pesos, façam fine-tune e auto-hospedem sem dependências de API. Benchmarks independentes (Semgrep) encontraram que GLM-5.2 venceu Claude Code em detecção de vulnerabilidades IDOR a $0,17 por bug encontrado.
O lançamento marca o primeiro modelo de código aberto a genuinamente reduzir a lacuna de fronteira em tarefas de codificação em produção, pressionando diretamente a economia de modelos fechados. O CEO da Snowflake testou GLM-5.2 contra Opus 4.7 em benchmarks internos e o encontrou competitivo apesar do maior consumo de tokens. Com modelos OpenAI e Anthropic restritos por revisão governamental e precificados em taxas premium ($30–$50/M tokens), o preço agressivo de Z.ai e licenciamento MIT criam uma fronteira de custo-qualidade que empresas implantando modelos customizados em escala acharão difícil ignorar.
Fontes
- Primary source
- the-decoder.com
“On FrontierSWE, a benchmark for hours-long coding tasks, the open-source model trails Anthropic's Claude Opus 4.8 by just one percentage point”
- semgrep.dev
“GLM 5.2 beat Claude Code by seven points (39% vs. 32%)”
- cnbc.com
“Zhipu's GLM 5.2 artificial intelligence model landed last week with the kind of Silicon Valley buzz that followed DeepSeek's launch”