Which tokens does a hybrid model predict better? カバー画像

Hugging Face

Hugging Face が Which tokens does a hybrid model predict better? をリリース ── ハイブリッドモデルとTransformerの得意分野がトークンレベルで判明

Byren_admin 2026年6月26日

HUGGING FACE

最終更新: 2026年06月26日 02:02　元記事 →

ハイブリッドアーキテクチャのLLMって、実際のところ何が優れてるんだろう？ベンチマークのスコアが良いのは分かるけど、具体的にどういう場面で強いのかはモヤっとしたままだった。そこでAi2が自社のOlmo 3とOlmo Hybridを徹底比較して、なかなか興味深い結果を弾き出してきた。

▸何が変わったのか

公開された技術レポートでは、独自の7Bトランスフォーマーモデル「Olmo 3」とハイブリッドモデル「Olmo Hybrid」を直接対决させている。学習データやトークナイザーを可能な限り一致させているため、予測の差は純粋にアーキテクチャの違いから来るもの。結果として、ハイブリッドモデルは名詞や動詞といった意味を持つトークンや、代名詞の指示先など文脈を追う必要があるトークンで圧倒的な強さを発揮することが判明。逆に、前の入力をそのまま繰り返すだけのトークン予測では、ハイブリッドの優位性はほぼ消え失せてしまった。この領域こそが、従来のトランスフォーマーの真骨頂だ。

◈前モデル / 競合との比較

Olmo 3（トランスフォーマー）とOlmo Hybridの比較。意味を持つトークンの予測ではハイブリッドが有利だが、入力内の単語の繰り返し（コピペ）予測ではOlmo 3が強いという明確な住み分けが存在する。

◈技術背景と意義

普通のTransformerは、過去のすべての単語を一気に参照して関連度を測る仕組みを採用している。正確なコピーができる反面、文章が長くなるほど計算コストが跳ね上がるし、時系列で変化する情報の表現が少し苦手。一方のハイブリッドモデルは、Attention層を少し残しつつ、残りを「Recurrent層」に置き換えている。左から右へと情報を読み込み、一定サイズのメモリに畳み込んでいくから、処理コストが一定に保たれる仕組みだ。つまり、長い文脈を追って深く理解するのはハイブリッドが得意で、遥か昔の単語をピンポイントで引き写すのはTransformerが得意ということ。

▸こんな人・用途に

長文の文脈理解や、登場人物の関係性など意味的なつながりを重視する文章生成。一方で、厳密なプロンプトの指示漏れや、入力テキストの忠実な再現が求められるタスクでは従来のトランスフォーマーが向いている。

◆入手方法・リンク

技術レポートの詳細はarXiv（https://arxiv.org/abs/2606.20936）で公開されている。モデル本体やコードの公開状況は今回の情報には含まれていない。

公式発表を読む

SOURCE: Hugging Face (2026-06-25)

← LLM Watch トップへ

Hugging Face

Hugging Face の How an Agent Built a 3D Paris Gallery by Chaining Two Hugging Face Spaces をリリース ── エージェントが2つのSpaceを連鎖させてパリの3Dギャラリーを自動構築
Byren_admin 2026年6月9日

エージェントがideogram4とTripoSplatの2つのSpaceを連鎖させ、パリの記念碑を3D Gaussian splatで展示するギャラリーを全自動で構築した事例を紹介。

続きを読む Hugging Face の How an Agent Built a 3D Paris Gallery by Chaining Two Hugging Face Spaces をリリース ── エージェントが2つのSpaceを連鎖させてパリの3Dギャラリーを自動構築
Hugging Face

Hugging Face が Welcome Gemma 4: Frontier multimodal intelligence on device をリリース ── 画像・音声・テキスト対応の超優秀なマルチモーダルモデル登場
Byren_admin 2026年4月3日2026年4月5日

GoogleのGemma 4が登場。音声・画像対応でデバイス上でも動く、Apache 2.0ライセンスのマルチモーダルモデル。

続きを読む Hugging Face が Welcome Gemma 4: Frontier multimodal intelligence on device をリリース ── 画像・音声・テキスト対応の超優秀なマルチモーダルモデル登場
Hugging Face

Hugging Face が Granite 4.0 1B Speech: Compact, Multilingual, and Built for the Edge をリリース ── パラメータ半減で日本語対応も実現した小型音声モデル
Byren_admin 2026年3月10日2026年3月10日

Granite 4.0 1B Speech登場。パラメータ半減で精度向上と日本語対応を実現。

続きを読む Hugging Face が Granite 4.0 1B Speech: Compact, Multilingual, and Built for the Edge をリリース ── パラメータ半減で日本語対応も実現した小型音声モデル
Google DeepMind

Google DeepMind が Gemini Robotics-ER 1.6 をリリース ── 自律的ロボティクスのため空間推論能力を強化
Byren_admin 2026年4月15日2026年4月15日

Google DeepMindが自律型ロボット向けモデル「Gemini Robotics-ER 1.6」を発表。空間推論と多視点理解を強化し、複雑な現実世界のタスクに対応する。

続きを読む Google DeepMind が Gemini Robotics-ER 1.6 をリリース ── 自律的ロボティクスのため空間推論能力を強化
Hugging Face

Hugging Face が How NVIDIA Builds Open Data for AI を公開 ── NVIDIAが隠さない「2ペタバイト」のデータ戦略
Byren_admin 2026年3月11日

NVIDIAが2ペタバイトのオープンデータを公開。ロボティクスや自動運転の開発を加速させる。

続きを読む Hugging Face が How NVIDIA Builds Open Data for AI を公開 ── NVIDIAが隠さない「2ペタバイト」のデータ戦略
OpenAI

OpenAI が GPT-5.5 をリリース ── 史上最速・最高性能の新モデルが登場
Byren_admin 2026年4月24日2026年4月26日

OpenAIがGPT-5.5をリリース。史上最もスマートなモデルで、コーディング・リサーチ・データ分析に強い。

続きを読む OpenAI が GPT-5.5 をリリース ── 史上最速・最高性能の新モデルが登場

コメントを残すコメントをキャンセル