GLM-5.2 カバー画像

Hugging Face が GLM-5.2 をリリース ── 100万トークンを安定処理するロングホライズン特化モデル

HUGGING FACE

最終更新: 2026年06月17日 19:03 元記事 →

またしてもとんでもないモデルが登場した。Z.AIが送り出した最新フラッグシップ「GLM-5.2」は、100万トークンという超長文脈を安定して処理できるらしい。しかもただ読み込むだけでなく、数時間〜数十時間規模の長期タスクを完遂する能力に特化している。これはエージェント作業の常識が変わるレベルの熱さだ。

何が変わったのか

最大の目玉は、堅牢な「1Mトークンコンテキスト」。ただ長いだけじゃなく、長くて乱雑なコーディングエージェントの軌跡でも安定して品質を維持するのがキモ。新アーキテクチャ「IndexShare」の導入により、1Mコンテキストでのトークンあたりの計算量を2.9倍削減することに成功した。推測デコーディング用のMTPレイヤーも改善され、受け入れ長が最大20%向上している。コーディングベンチマーク「Terminal-Bench 2.1」では81.0(前世代のGLM-5.1は63.5)をマークするなど、大幅な進化を遂げている。

前モデル / 競合との比較

競合のOpus 4.8やGPT-5.5とガチのトップ争いを繰り広げている。FrontierSWEベンチマークではOpus 4.8にわずか1%差まで肉薄し、GPT-5.5を1%上回る。PostTrainBenchではOpus 4.7やGPT-5.5を凌駕してOpus 4.8に次ぐ2位。SWE-MarathonでもOpus 4.8に13%差ながら2位をキープ。全ベンチマークで最高位のオープンソースモデルとして名を連ねている。

技術背景と意義

「ロングホライズン・タスク」とは、コンパイラ構築やシステム最適化など、人間なら数時間〜数十時間かかるような泥臭いエンジニアリング作業のこと。これまでのAIは「100万トークン読めます」と宣伝しても、実際の複雑なタスクではエラーが頻発し、息切れしがちだった。GLM-5.2のすごいところは、大規模なコード実装から自動研究まで、実戦のエンジニアリング圧力下でも安定して動くようにトレーニングされた点だ。

こんな人・用途に

大規模なコード実装や複雑なデバッグ、自動化されたリサーチなど、AIエージェントに長時間の自律作業を任せたいソフトウェアエンジニアに最適。また、H100 GPU環境を与えられて小規模モデルのポストトレーニングを回すような、高度なML研究の自動化用途にも強さを発揮する。

入手方法・リンク

提供テキスト内では「Pure Open」としてMITライセンスでの提供が謳われているが、今回の情報時点では具体的なGitHubリンクやAPIの公開場所は不明。公式発表やHugging Faceのページを通じて詳細を確認する必要がある。

SOURCE: Hugging Face (2026-06-17)

← LLM Watch トップへ

類似投稿

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です