GLM-5.2
Z.AIは長時間タスク向けのフラッグシップモデルGLM-5.2を公開した。前版GLM-5.1から長時間実行能力を大きく伸ばし、最大100万トークンのコンテキストを安定して使える設計にした。モデルウェイトはMIT LicenseでHugging FaceとModelScopeから入手でき、Z.AIのAPIやGLM Coding Plan、ZCodeデスクトップエージェントからも利用できる。
主な変更点は次のとおりである。
- 最大100万トークンのコンテキスト(GLM-5.1は20万トークン)。コーディングエージェントの長い軌跡を想定した学習を拡大している。
- IndexShareによるスパースアテンションの効率化。4層ごとにインデクサを共有し、100万トークン時のトークンあたりFLOPsを2.9倍削減する。
- 推測デコード向けMTP層の改善。受理長を最大20%伸ばす。
- 思考努力レベル(High / Max)の選択。Coding Planではピーク時3倍、オフピーク時2倍のクォータ消費(オフピークは9月末まで1倍のプロモーション)。
Z.AIの評価では、Terminal-Bench 2.1で81.0(GLM-5.1は63.5)、SWE-bench Proで62.1(58.4)と標準的なコーディングベンチで前版を大きく上回る。FrontierSWE、PostTrainBench、SWE-Marathonの3つの長時間コーディングベンチでは、いずれもオープンウェイトモデルの中で最高位となる。
性能
| モデル | Artificial Analysis Intelligence Index | 出力速度 (tok/s) |
|---|---|---|
| GLM-5.2 (max) | 51 | 114.5 |
| Claude Opus 4.8 (Adaptive Reasoning, Max Effort) | 56 | 63.3 |
| GPT-5.5 (xhigh) | 55 | 66.8 |
| GLM-5.1 (Reasoning) | 51 | 51.0 |
Intelligence IndexではOpus 4.8やGPT-5.5にわずかに及ばないものの、出力速度は比較対象の中で最も速い。
API 価格の比較
| モデル | 入力 ($/1M) | 出力 ($/1M) |
|---|---|---|
| GLM-5.2 | 1.4 | 4.4 |
| Claude Opus 4.8 | 5.0 | 25.0 |
| GPT-5.5 | 5.0 | 30.0 |
| Gemini 3.1 Pro Preview | 2.0 | 12.0 |
入出力いずれも比較対象の中では低単価側にあり、GLM-5.1と同一料金帯である。