Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality カバー画像

Hugging Face が Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality をリリース ── 100Mパラメータ未満で最高峰、32Kコンテキスト対応の多言語Embedding

HUGGING FACE

最終更新: 2026年05月15日 04:02 元記事 →

多言語対応の検索モデルで、かなりヤバい性能のやつが出た。100Mパラメータ未満というコンパクトサイズで、同クラスのオープンモデルをぶっちぎるスコアを叩き出している。しかもコンテキスト長は32,768トークン。多言語RAG構築の強い味方になりそうだ。

何が変わったのか

今回リリースされたのは「granite-embedding-311m-multilingual-r2」と「granite-embedding-97m-multilingual-r2」の2モデル。ベースにはModernBERTが使われている。最大の注目ポイントはコンテキスト長で、前作のR1から64倍にあたる「32,768 tokens」まで扱えるようになった点。200以上の言語を網羅しつつ、52の言語とプログラミングコードに特化してチューニングされている。97Mのコンパクトモデルは、MTEB Multilingual Retrievalで「60.3」を記録し、100M未満のオープンモデルとして最高のリトリーバル品質をマーク。Apache 2.0ライセンスで商用利用も安心だ。

前モデル / 競合との比較

前バージョンのR1と比べ、コンテキスト長が64倍の「32,768 tokens」に拡張。311Mモデル(768次元)だけでなく、97Mという軽量モデル(384次元)が追加され、より限られたリソースでも扱いやすくなった。さらに、9つのプログラミング言語に対するコード検索機能も追加されている。

技術背景と意義

Embedding(埋め込み)モデルは、文章の意味をコンピュータが理解できる数値のベクトルに変換する技術。RAG(外部知識をAIに読み込ませる手法)などで、検索精度を左右する超重要パーツだ。これまでは「多言語に対応させるとモデルが重くなる」「軽くすると精度が落ちる」というジレンマがあった。今回のGranite Embeddingは、そのバランスを見事に突き崩してきた。

こんな人・用途に

– グローバル展開を見据えた多言語コーパスを使ったRAGの構築
– 異なる言語圏のメンバーがいる国際チームでのコード検索
– クロスリンガル(異言語間)検索システムの導入

入手方法・リンク

Hugging Faceにて公開中。sentence-transformersやtransformersはもちろん、LangChain、LlamaIndex、Haystack、Milvusなどでもモデル名を変更するだけでDrop-in可能。ONNXやOpenVINOのウェイトも用意されており、CPU推論にも最適化されている。

SOURCE: Hugging Face (2026-05-14)

← LLM Watch トップへ

類似投稿

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です