Hugging Face が Ettin Reranker ファミリーをリリース ── ModernBERTベースで17Mから1Bまで揃う超実戦的なラインナップ
RAGの検索精度を決定づける「リランカー」の超強力な新ラインナップがHugging Faceから登場。パラメータ17Mの超軽量モデルから1Bの大型モデルまで6種類が一気に公開された。どれも同サイズの既存モデルを凌駕する精度を叩き出しているらしい。
▸何が変わったのか
Tom Aarsen氏が「Ettin」ことModernBERTエンコーダをベースにした6つの新しいCrossEncoderリランカーを公開。ラインナップは「17m」「32m」「68m」「150m」「400m」「1b」と非常に細かく粒度が分かれている。トレーニングには「mixedbread-ai/mxbai-rerank-large-v2」のスコアを教師信号とする蒸留(Distillation)レシピが採用された。また、学習に使われたデータセットも公開されている。
◈前モデル / 競合との比較
従来のリランカーよりも現代的なアーキテクチャ(ModernBERTベース)を採用しており、各サイズにおいてSOTA(最高精度)を狙う構成。特に「mxbai-rerank-large-v2」を教師とした蒸留アプローチにより、小型化しても精度が崩れにくい設計になっている。
◈技術背景と意義
リランカー(クロスエンコーダー)は、検索クエリと文書をセットにして読み込み、関連性のスコアを直接弾き出すモデル。通常の埋め込み(エンベディング)検索より圧倒的に精度が高いが、計算コストも重い。そこで本番環境では、まず軽いエンベディングで上位候補を絞り、その後このリランカーで高精度に並び替える「retrieve-then-rerank」という2段構えが定石になっている。
▸こんな人・用途に
社内データや専門文書を使った高精度なRAGチャットボットの構築。大規模なナレッジベースからピンポイントで情報を引き当てたい検索システム全般。自分専用のデータでリランカーをファインチューニングしたい開発者。
◆入手方法・リンク
Hugging Faceのモデルハブ上で「cross-encoder/ettin-reranker-〇〇-v1」として直接公開されている。自作モデルの学習には、Sentence Transformers v5.5.0で追加された「train-sentence-transformers」エージェントスキルが便利。
SOURCE: Hugging Face (2026-05-19)
