GLM-5.2 - ohiruneuni/blog

Z.AIは長時間タスク向けのフラッグシップモデルGLM-5.2を公開した。前版GLM-5.1から長時間実行能力を大きく伸ばし、最大100万トークンのコンテキストを安定して使える設計にした。モデルウェイトはMIT LicenseでHugging FaceとModelScopeから入手でき、Z.AIのAPIやGLM Coding Plan、ZCodeデスクトップエージェントからも利用できる。

主な変更点は次のとおりである。

最大100万トークンのコンテキスト（GLM-5.1は20万トークン）。コーディングエージェントの長い軌跡を想定した学習を拡大している。
IndexShareによるスパースアテンションの効率化。4層ごとにインデクサを共有し、100万トークン時のトークンあたりFLOPsを2.9倍削減する。
推測デコード向けMTP層の改善。受理長を最大20%伸ばす。
思考努力レベル（High / Max）の選択。Coding Planではピーク時3倍、オフピーク時2倍のクォータ消費（オフピークは9月末まで1倍のプロモーション）。

Z.AIの評価では、Terminal-Bench 2.1で81.0（GLM-5.1は63.5）、SWE-bench Proで62.1（58.4）と標準的なコーディングベンチで前版を大きく上回る。FrontierSWE、PostTrainBench、SWE-Marathonの3つの長時間コーディングベンチでは、いずれもオープンウェイトモデルの中で最高位となる。

#性能

モデル	Artificial Analysis Intelligence Index	出力速度 (tok/s)
GLM-5.2 (max)	51	114.5
Claude Opus 4.8 (Adaptive Reasoning, Max Effort)	56	63.3
GPT-5.5 (xhigh)	55	66.8
GLM-5.1 (Reasoning)	51	51.0

Intelligence IndexではOpus 4.8やGPT-5.5にわずかに及ばないものの、出力速度は比較対象の中で最も速い。

#API 価格の比較

モデル	入力 ($/1M)	出力 ($/1M)
GLM-5.2	1.4	4.4
Claude Opus 4.8	5.0	25.0
GPT-5.5	5.0	30.0
Gemini 3.1 Pro Preview	2.0	12.0

入出力いずれも比較対象の中では低単価側にあり、GLM-5.1と同一料金帯である。

#性能

#API 価格の比較

#参考文献