Qwen3.5-35B-A3B-Base-W128K-L0_100 カバー画像

Alibaba (Qwen)

Alibaba (Qwen) が Qwen3.5-35B-A3B-Base-W128K-L0_100 をリリース ── Qwenの頭の中を覗き見るSAE解釈モジュール

ByLLM Watch編集部 2026年4月30日

ALIBABA (QWEN)OSS

最終更新: 2026年04月30日 18:04　元記事 →

AIモデルの頭の中で何が起きてるのか、気になったことある？アリババのQwenチームがまさにそれを実現するツールを投下した。Sparse Autoencoder（SAE）をQwen3.5の隠れ層に組み込んだ「Qwen-Scope」——これはLLMのブラックボックスを開けるための、かなり本気なアプローチだ。

▸何が変わったのか

今回リリースされたのは新しい対話AIじゃない。Qwen3.5-35B-A3Bの内部を解析するための Sparse Autoencoder モジュール「Qwen-Scope」だ。全40層（レイヤー0〜39）それぞれに対応するSAEチェックポイントが用意されている。各SAEは131,072の幅（dsae）を持ち、隠れ層サイズ2,048に対して64倍の拡張率を設定。TopK SAEアーキテクチャを採用し、各フォワードパスでちょうど100個の特徴量を非ゼロとして保持する仕組み。Hook pointはResidual stream。ファイル形式はPyTorchの.pt dictで、エンコーダ・デコーダの重み行列とバイアスが含まれている。

◈技術背景と意義

LLMはパラメータの海で、何を根拠に回答してるのか人間にはさっぱりわからない。そこでSAEの出番。スパース性制約をかけることで、モデルの内部表現を「疎で解釈しやすい特徴」に自動分解できる。つまり、どのニューロンが「猫」に反応し、どのパターンが「否定語」を拾っているのか——そういうのを可視化できる。Qwen-Scopeは、この手法をQwen3.5に特化して訓練したもの。モデルの最適化や推論制御にも応用が期待できるらしい。

▸こんな人・用途に

・AI研究者：Qwenの内部メカニズムを分析し、ステアリング可能な推論制御やモデル最適化に活用
・データサイエンティスト：評価サンプルの分布分析・比較、データ分類・合成タスクへの応用
・LLMの挙動を理解したい開発者：ポストトレーニング済みモデルの内部プロセス探索にも流用可能

◆入手方法・リンク

Hugging Faceでオープンソース公開中。GitHubリポジトリの記載はなし。PyTorch形式のチェックポイントがレイヤーごとにダウンロードできる。

公式発表を読む

SOURCE: Alibaba (Qwen) (2026-04-27)

← LLM Watch トップへ

Tencent

Tencent が Hy3-preview をリリース ── 295B MoEの怪物、コード・エージェント性能がヤバい
ByLLM Watch編集部 2026年4月23日

Tencentが295B MoEモデルHy3-previewを公開。アクティブ21BでDeepSeek-V3に肉薄、コード・エージェント性能が突出。

続きを読む Tencent が Hy3-preview をリリース ── 295B MoEの怪物、コード・エージェント性能がヤバい
Alibaba (Qwen)

Alibaba (Qwen) が Qwen3-ForcedAligner-0.6B-hf をリリース
ByLLM Watch編集部 2026年6月26日

Alibaba (Qwen)のQwen3-ForcedAligner-0.6B-hfリリース情報

続きを読む Alibaba (Qwen) が Qwen3-ForcedAligner-0.6B-hf をリリース
Tencent

Tencent が Penguin-VL-2B をリリース ── LLMを「目」に改造した画期的な効率化モデル
ByLLM Watch編集部 2026年3月7日2026年3月10日

TencentがLLMベースのビジョンエンコーダを採用したVLM「Penguin-VL-2B」をOSSで公開。効率的な動画理解が特徴。

続きを読む Tencent が Penguin-VL-2B をリリース ── LLMを「目」に改造した画期的な効率化モデル
Alibaba (Qwen)

Alibaba (Qwen) が Qwen-AgentWorld-35B-A3B をリリース
ByLLM Watch編集部 2026年6月24日

Alibaba (Qwen)のQwen-AgentWorld-35B-A3Bリリース情報

続きを読む Alibaba (Qwen) が Qwen-AgentWorld-35B-A3B をリリース
Tencent

Tencent が Hy-MT1.5-1.8B-1.25bit をリリース ── 440MBで33言語翻訳、スマホでサクサク動く極限の軽量モデル
ByLLM Watch編集部 2026年4月29日

Tencentが超軽量翻訳モデル「Hy-MT1.5-1.8B-1.25bit」をリリース。440MBでスマホオフライン動作可能な驚異的な1.25ビット量子化を実現。

続きを読む Tencent が Hy-MT1.5-1.8B-1.25bit をリリース ── 440MBで33言語翻訳、スマホでサクサク動く極限の軽量モデル
Tencent

Tencent が Sequential-Hidden-Decoding-8B-n4 をリリース ── 推論ステップを「隠し」て性能を爆上げ
ByLLM Watch編集部 2026年3月10日

Tencentが「Sequential-Hidden-Decoding-8B-n4」を公開。Embedding追加のみで性能を引き出す新手法。

続きを読む Tencent が Sequential-Hidden-Decoding-8B-n4 をリリース ── 推論ステップを「隠し」て性能を爆上げ

コメントを残すコメントをキャンセル