Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality カバー画像

Hugging Face が Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality をリリース ── 100Mパラメータ未満で最高峰、32Kコンテキスト対応の多言語Embedding

ByLLM Watch編集部 2026年5月15日

HUGGING FACE

最終更新: 2026年05月15日 04:02　元記事 →

多言語対応の検索モデルで、かなりヤバい性能のやつが出た。100Mパラメータ未満というコンパクトサイズで、同クラスのオープンモデルをぶっちぎるスコアを叩き出している。しかもコンテキスト長は32,768トークン。多言語RAG構築の強い味方になりそうだ。

▸何が変わったのか

今回リリースされたのは「granite-embedding-311m-multilingual-r2」と「granite-embedding-97m-multilingual-r2」の2モデル。ベースにはModernBERTが使われている。最大の注目ポイントはコンテキスト長で、前作のR1から64倍にあたる「32,768 tokens」まで扱えるようになった点。200以上の言語を網羅しつつ、52の言語とプログラミングコードに特化してチューニングされている。97Mのコンパクトモデルは、MTEB Multilingual Retrievalで「60.3」を記録し、100M未満のオープンモデルとして最高のリトリーバル品質をマーク。Apache 2.0ライセンスで商用利用も安心だ。

◈前モデル / 競合との比較

前バージョンのR1と比べ、コンテキスト長が64倍の「32,768 tokens」に拡張。311Mモデル（768次元）だけでなく、97Mという軽量モデル（384次元）が追加され、より限られたリソースでも扱いやすくなった。さらに、9つのプログラミング言語に対するコード検索機能も追加されている。

◈技術背景と意義

Embedding（埋め込み）モデルは、文章の意味をコンピュータが理解できる数値のベクトルに変換する技術。RAG（外部知識をAIに読み込ませる手法）などで、検索精度を左右する超重要パーツだ。これまでは「多言語に対応させるとモデルが重くなる」「軽くすると精度が落ちる」というジレンマがあった。今回のGranite Embeddingは、そのバランスを見事に突き崩してきた。

▸こんな人・用途に

– グローバル展開を見据えた多言語コーパスを使ったRAGの構築
– 異なる言語圏のメンバーがいる国際チームでのコード検索
– クロスリンガル（異言語間）検索システムの導入

◆入手方法・リンク

Hugging Faceにて公開中。sentence-transformersやtransformersはもちろん、LangChain、LlamaIndex、Haystack、Milvusなどでもモデル名を変更するだけでDrop-in可能。ONNXやOpenVINOのウェイトも用意されており、CPU推論にも最適化されている。

公式発表を読む

SOURCE: Hugging Face (2026-05-14)

← LLM Watch トップへ

OpenAI

OpenAI が Top 10 uses for Codex at work を公開 ── 実務で使えるCodex活用術
ByLLM Watch編集部 2026年4月24日

OpenAIが仕事でのCodex活用法10選を公開。複数のツールやファイルを横断し、実務の入力をアウトプットに変換するワークフローが話題だ。

続きを読む OpenAI が Top 10 uses for Codex at work を公開 ── 実務で使えるCodex活用術
Hugging Face

Hugging Face が Experimenting with the proposed Cross-Origin Storage API in Transformers.js をリリース ── ブラウザAIの無駄な重複ダウンロードを解消する画期的なアプローチ
ByLLM Watch編集部 2026年6月24日

Transformers.jsで提案中のCross-Origin Storage APIを紹介。異なるWebサイト間でのAIモデルの重複ダウンロード問題を解消する新しいアプローチ。

続きを読む Hugging Face が Experimenting with the proposed Cross-Origin Storage API in Transformers.js をリリース ── ブラウザAIの無駄な重複ダウンロードを解消する画期的なアプローチ
OpenAI

OpenAI が How frontier enterprises are building an AI advantage をリリース ── 企業のAI活用、次のフェーズへ
ByLLM Watch編集部 2026年5月7日

OpenAIのB2B Signals researchが企業のAI導入実態を公開。Codexを活用したagentic workflowsのスケールなど注目ポイントを紹介。

続きを読む OpenAI が How frontier enterprises are building an AI advantage をリリース ── 企業のAI活用、次のフェーズへ
OpenAI

OpenAI が Axios開発ツールの侵害 incident に対応 ── 証明書ローテーションと安全性確認
ByLLM Watch編集部 2026年4月12日

OpenAIがAxios経由のサプライチェーン攻撃に対応。macOS証明書をローテーションし、ユーザーデータへの影響なしと確認。

続きを読む OpenAI が Axios開発ツールの侵害 incident に対応 ── 証明書ローテーションと安全性確認
Hugging Face

Hugging Face が「Data for Agents」を特集 ── 本物のAIエージェントを作る鍵は合成データにあり
ByLLM Watch編集部 2026年7月9日

NVIDIAが語る本物のAIエージェント開発の鍵。API失敗からの復帰や複雑な推論を支える合成データの重要性とは。

続きを読む Hugging Face が「Data for Agents」を特集 ── 本物のAIエージェントを作る鍵は合成データにあり
OpenAI

OpenAI が自己改善型タックスエージェントを構築 ── Codex活用で確定申告を自動化
ByLLM Watch編集部 2026年5月28日

OpenAIがThrive、Creteと共同でCodexを活用した自己改善型の税務エージェントを構築。申告の自動化と精度向上を実現しました。

続きを読む OpenAI が自己改善型タックスエージェントを構築 ── Codex活用で確定申告を自動化

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

◆入手方法・リンク

類似投稿

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル