Qwen3-30B-A3B-Base-W128K-L0_100 カバー画像

Alibaba (Qwen)

Alibaba (Qwen) が Qwen-Scope (SAE) をリリース ── Qwen3-30B-A3Bの内部を131,072次元で解読

ByLLM Watch編集部 2026年4月30日

ALIBABA (QWEN)OSS

最終更新: 2026年04月30日 18:06　元記事 →

LLMの「ブラックボックス問題」にまた一つアプローチが届いた。AlibabaのQwenチームが、モデル内部の仕組みを解読する「Qwen-Scope」をHugging Faceに公開した。Sparse Autoencoder（SAE）を使って、Qwen3-30B-A3Bの隠れ層から解釈可能な特徴を抽出する仕組み。LLMの脳内をマッピングするような試みで、個人的にかなりワクワクする方向性。

▸何が変わったのか

Qwen-ScopeはQwen3およびQwen3.5シリーズ上で訓練された解釈可能性モジュール。SAE width（dsae）を131,072、Hidden size（dmodel）を2,048に設定し、Expansion factorは64×。アーキテクチャはTopK SAEで、各forward passで厳密に100個の特徴を非ゼロとして保持する。レジデュアルストリームをhook pointとして、全48層（0–47）をカバー。各層のチェックポイントはPyTorch .pt形式の辞書で提供され、Wenc、Wdec、benc、bdecの4つのテンソルが含まれる。

◈技術背景と意義

LLMは巨大な数値計算の塊で、「なぜその回答が出たのか」が分かりにくい。SAE（Sparse Autoencoder）はこの問題に取り組む技術で、モデル内部の表現を「スパース（疎）な」形に変換することで、人間が解読しやすい特徴に分解する。スパース性制約をかけることで、高く分離された低冗長な特徴を自動抽出できる。Anthropicもこの手法に力を入れていて、LLMの解釈可能性研究では今かなり注目の領域。

▸こんな人・用途に

LLMの挙動を分析したい研究者──「なぜこの出力になったのか」を内部特徴から追える。モデル最適化に取り組むエンジニア──制御可能な推論（steerable inference）やデータ分類・合成に活用可能。評価サンプルの分布分析や比較にも使えるらしい。

◆入手方法・リンク

Hugging Faceで公開中。各層のSAEチェックポイント（layer0.sae.pt〜layer47.sae.pt）がダウンロードできる。READMEにはtransformersライブラリを使った特徴抽出のデモコードも記載されている。

公式発表を読む

SOURCE: Alibaba (Qwen) (2026-04-27)

← LLM Watch トップへ

Tencent

Tencent が R3-embedding-0.6b をリリース ── AIエージェントの「スキル選び」に特化した検索モデル
ByLLM Watch編集部 2026年7月8日

TencentがAIエージェントのスキルルーティングに特化した検索モデルR3-embedding-0.6bを公開。Qwen3ベースの2段階リトリーバー。

続きを読む Tencent が R3-embedding-0.6b をリリース ── AIエージェントの「スキル選び」に特化した検索モデル
Tencent

Tencent が Hy-Embodied-0.5-VLA-RoboTwin をリリース ── ロボット操作タスクで成功率90%超を叩き出すVLAモデル
ByLLM Watch編集部 2026年6月15日

TencentがVLAモデル「Hy-Embodied-0.5-VLA-RoboTwin」を公開。RoboTwin 2.0ベンチマークで成功率90%超を達成し、異なる実機ロボットへの転移にも成功。

続きを読む Tencent が Hy-Embodied-0.5-VLA-RoboTwin をリリース ── ロボット操作タスクで成功率90%超を叩き出すVLAモデル
Alibaba (Qwen)

Alibaba (Qwen) が Qwen-Image-Bench をリリース ── AIが画像生成を自動採点する新時代
ByLLM Watch編集部 2026年5月28日

Alibabaが画像生成（T2I）の品質を自動評価するQwen-Image-Benchを公開。Qwen3.6-27BベースのQ-Judgerが思考推論を経て詳細に採点する。

続きを読む Alibaba (Qwen) が Qwen-Image-Bench をリリース ── AIが画像生成を自動採点する新時代
Alibaba (Qwen)

Alibaba (Qwen) が Qwen3.6-27B をリリース ── エージェント型コーディングで27Bモデルがついに覚醒
ByLLM Watch編集部 2026年4月22日2026年4月24日

AlibabaのQwen3.6-27Bが登場。エージェント型コーディング能力が大幅向上し、Terminal-Benchで驚異のスコアを記録した27Bモデル。

続きを読む Alibaba (Qwen) が Qwen3.6-27B をリリース ── エージェント型コーディングで27Bモデルがついに覚醒
Tencent

Tencent が HY-OmniWeaving をリリース ── テキスト・画像・動画を自由に入力できる統合動画生成モデル
ByLLM Watch編集部 2026年4月3日

Tencent HunyuanがOmniWeavingをリリース。テキスト・画像・動画の自由な組み合わせで高品質な動画を生成するオープンソースモデル。

続きを読む Tencent が HY-OmniWeaving をリリース ── テキスト・画像・動画を自由に入力できる統合動画生成モデル
Tencent

Tencent が HY-Embodied-0.5 をリリース ── 思考モードを搭載した画像言語モデル
ByLLM Watch編集部 2026年4月9日

Tencentが画像と言語を処理するオープンソースモデル「HY-Embodied-0.5」を公開。16GB VRAMで動作し、思考モードも搭載。

続きを読む Tencent が HY-Embodied-0.5 をリリース ── 思考モードを搭載した画像言語モデル

コメントを残すコメントをキャンセル