GLM-5.2 カバー画像

Zhipu AI が GLM-5.2 をリリース ── 1Mコンテキスト対応&コーディングベンチが爆伸び

ZHIPU AIOSS

最終更新: 2026年06月17日 03:02 元記事 →

中国のZhipu AIが送り出す最新モデル「GLM-5.2」がHugging Faceに登場した。前モデルから一気に進化した100万トークン(1M)のコンテキスト対応と、異常なまでの進化を遂げたコーディング能力。MITライセンスで国境制限なく使えるこのモデル、スペックを見る限り本気度がかなり違う。

何が変わったのか

最大の目玉は「Solid 1M Context」。100万トークンという超長文を安定して処理できるようになった。さらに新アーキテクチャ「IndexShare」を導入し、1Mコンテキスト時のトークンあたりの計算量を2.9倍削減している。個人的にめちゃくちゃ驚いたのがコーディングスコアの爆伸びで、「DeepSWE」が18から46.2、「FrontierSWE (Dominance)」は30.5から74.4にまで跳ね上がった。推論系の「AIME 2026」も95.3から99.2へ向上し、MITライセンスで完全オープンなのも嬉しい限り。

前モデル / 競合との比較

前モデル「GLM-5.1」から全体的な底上げが顕著で、特にコーディング系ベンチマークの「SWE-Marathon」は1.0から13.0へ激増。競合のClaude Opus 4.8やGPT-5.5と比較しても、「Terminal Bench 2.1」などで肩を並べるハイスコアを叩き出している。

技術背景と意義

そもそも100万トークンのコンテキストを扱うと、計算コストが天文学的になってしまう。それを解決するため、GLM-5.2では4つのスパースアテンションレイヤーごとに同じインデクサーを再利用する「IndexShare」という仕組みを提案。無駄な計算を大幅にカットしている。さらにMTPレイヤーを改善した投機的デコーディングにより、生成の受け入れ長を最大20%伸ばして推論速度の低下を防いでいる。超長文処理と計算効率の両立を突き詰めた素晴らしい設計だ。

こんな人・用途に

ターミナル操作やリポジトリ構築など、自律的にコードを書き進めるエージェントタスク。複数の思考レベルでパフォーマンスとレイテンシを調整できるため、実践的な開発現場での相性が抜群に良さそう。

入手方法・リンク

Hugging FaceでMITライセンスのオープンソースとして公開中。Z.ai API Platformからも試せる。ローカル環境で動かしたい場合も、vLLM(v0.23.0+)やSGLang(v0.5.13.post1+)、Transformers(v0.5.12+)など主要なフレームワークがすでに対応済み。

SOURCE: Zhipu AI (2026-06-16)

← LLM Watch トップへ

類似投稿

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です