Hugging Face が Ettin Reranker Family をリリース ── ModernBERT ベースの 6 サイズ展開、各クラス SOTA 狙い

HUGGING FACE

最終更新: 2026年05月20日 01:02　元記事 →

RAG の精度を左右する reranker モデルに、かなり有力な選択肢が増えた。Hugging Face の Tom Aarsen 氏が、Ettin ModernBERT エンコーダーをベースにした reranker ファミリー 6 本を一気に公開した。17M から 1B まで揃えていて、それぞれのサイズクラスで SOTA を狙う構え。トレーニングデータとレシピも全部公開されているのが嬉しい。

▸何が変わったのか

リリースされたのは以下の 6 つの CrossEncoder reranker モデル。

– cross-encoder/ettin-reranker-17m-v1
– cross-encoder/ettin-reranker-32m-v1
– cross-encoder/ettin-reranker-68m-v1
– cross-encoder/ettin-reranker-150m-v1
– cross-encoder/ettin-reranker-400m-v1
– cross-encoder/ettin-reranker-1b-v1

いずれも Ettin ModernBERT エンコーダーをベースに構築されている。トレーニングには mixedbread-ai/mxbai-rerank-large-v2 のスコアを教師信号とした蒸留レシピ（pointwise MSE）を採用。データセットは lightonai/embeddings-pre-training のサブセットと lightonai/embeddings-fine-tuning の再ランク済みサブセットを組み合わせた cross-encoder/ettin-reranker-v1-data を使用。MTEB(eng, v2) Retrieval で google/embeddinggemma-300m とペア検証済み。また Sentence Transformers v5.5.0 で追加された train-sentence-transformers Agent Skill を使えば、Claude Code や Cursor などの AI コーディングエージェントにファインチューニングを任せることも可能。

◈前モデル / 競合との比較

従来の reranker と比較して、Ettin ファミリーは 17M〜1B まで 6 段階のサイズバリエーションがあり、精度と推論コストのバランスを取りやすい。トレーニングには mixedbread-ai/mxbai-rerank-large-v2 を教師とした蒸留レシピを採用し、各サイズで SOTA を目指している点が特徴。

◈技術背景と意義

Reranker（クロスエンコーダー）は、クエリと文書のペアを同時に読み込んで関連性スコアを出力するモデル。一般的な Embedding モデルがクエリと文書を別々にベクトル化するのに対して、Reranker は全 Transformer レイヤーで両方のテキストを相互に参照できるため精度が高い。ただし計算コストが大きいので、実運用では軽量な Embedding モデルで上位 K 件を検索（Retrieve）してから、Reranker で高精度に並べ替える（Rerank）という二段構えが定石になっている。

▸こんな人・用途に

– 大規模コーパスからの高精度な検索システムを構築したい開発者・チーム
– RAG の検索精度を引き上げたいプロダクション環境（retrieve-then-rerank パイプラインの後段として）
– エッジデバイスや低遅延要件のプロジェクト（17M〜150M の小型モデル選択肢が豊富）

◆入手方法・リンク

Sentence Transformers の CrossEncoder モデルとして Hugging Face 上で公開されている。GitHub リポジトリはなくクローズドソース扱い。Sentence Transformers v5.5.0 以降で hf skills add train-sentence-transformers をインストールすれば、AI コーディングエージェント経由で独自データへのファインチューニングも可能。

公式発表を読む

▸Redditの反応

Hugging Faceからリリースされた新しいReranker「Ettin」がr/LocalLLaMAで話題に。17Mという極小サイズながら既存モデルを圧倒する性能に、実務での活用を期待する声が上がってる。

r/LocalLLaMA▲ 7

「Hugging Faceから検索用の新Rerankerが登場。17M〜1Bの6モデルが用意され、どれも大規模な既存モデルを上回ってるらしい。特にettin-17Mはms-marco-MiniLM系の全モデルを凌駕してるのが凄い。」

u/-Cubie-

r/LocalLLaMA▲ 2

「注目すべきはこの効率のカーブだね。ettin-17Mが全ms-marco-MiniLM v2を上回ったのはガチの成果。これらは本番RAGにおけるRerankerの事実上の最低ラインだったから、かなりエグい。」

u/Ok_Flow1232

SOURCE: Hugging Face (2026-05-19)

← LLM Watch トップへ

Hugging Face が Ettin Reranker Family をリリース ── ModernBERT ベースの 6 サイズ展開、各クラス SOTA 狙い

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

◆入手方法・リンク

▸Redditの反応

Hugging Face が hf CLI をエージェント最適化 ── トークン消費を最大6倍削減する仕組みとは

NVIDIA が Nemotron 3.5 ASR をリリース ── 600Mパラメータで40言語をリアルタイム文字起こし、多言語対応の厄介ごとを一撃で解消する構え

OpenAI が Applications of AI at OpenAI をリリース ── ChatGPT・Codex・APIの実活用を総まとめ

Hugging Face が Adding MCP Tools to Reachy Mini をリリース ── クラウドからロボットにスキルを即追加

OpenAI が How finance teams use Codex をリリース ── 財務チームの実務をCodexがどう変えるか具体例を公開

Google DeepMind が Decoupled DiLoCo: A new frontier for resilient, distributed AI training をリリース ── 地球規模の分散学習がさらに頑健に

コメントを残すコメントをキャンセル

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

◆入手方法・リンク

▸Redditの反応

類似投稿

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル