Zhipu AI が GLM-5.2 をリリース ── 1Mコンテキスト対応&コーディングベンチが爆伸び
中国のZhipu AIが送り出す最新モデル「GLM-5.2」がHugging Faceに登場した。前モデルから一気に進化した100万トークン(1M)のコンテキスト対応と、異常なまでの進化を遂げたコーディング能力。MITライセンスで国境制限なく使えるこのモデル、スペックを見る限り本気度がかなり違う。
▸何が変わったのか
最大の目玉は「Solid 1M Context」。100万トークンという超長文を安定して処理できるようになった。さらに新アーキテクチャ「IndexShare」を導入し、1Mコンテキスト時のトークンあたりの計算量を2.9倍削減している。個人的にめちゃくちゃ驚いたのがコーディングスコアの爆伸びで、「DeepSWE」が18から46.2、「FrontierSWE (Dominance)」は30.5から74.4にまで跳ね上がった。推論系の「AIME 2026」も95.3から99.2へ向上し、MITライセンスで完全オープンなのも嬉しい限り。
◈前モデル / 競合との比較
前モデル「GLM-5.1」から全体的な底上げが顕著で、特にコーディング系ベンチマークの「SWE-Marathon」は1.0から13.0へ激増。競合のClaude Opus 4.8やGPT-5.5と比較しても、「Terminal Bench 2.1」などで肩を並べるハイスコアを叩き出している。
◈技術背景と意義
そもそも100万トークンのコンテキストを扱うと、計算コストが天文学的になってしまう。それを解決するため、GLM-5.2では4つのスパースアテンションレイヤーごとに同じインデクサーを再利用する「IndexShare」という仕組みを提案。無駄な計算を大幅にカットしている。さらにMTPレイヤーを改善した投機的デコーディングにより、生成の受け入れ長を最大20%伸ばして推論速度の低下を防いでいる。超長文処理と計算効率の両立を突き詰めた素晴らしい設計だ。
▸こんな人・用途に
ターミナル操作やリポジトリ構築など、自律的にコードを書き進めるエージェントタスク。複数の思考レベルでパフォーマンスとレイテンシを調整できるため、実践的な開発現場での相性が抜群に良さそう。
◆入手方法・リンク
Hugging FaceでMITライセンスのオープンソースとして公開中。Z.ai API Platformからも試せる。ローカル環境で動かしたい場合も、vLLM(v0.23.0+)やSGLang(v0.5.13.post1+)、Transformers(v0.5.12+)など主要なフレームワークがすでに対応済み。
SOURCE: Zhipu AI (2026-06-16)
