Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI カバー画像

Hugging Face

NVIDIA が Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI をリリース ── 企業独自の安全ポリシーを適用できるマルチモーダルガードモデル

ByLLM Watch編集部 2026年6月5日

HUGGING FACE

最終更新: 2026年06月05日 04:02　元記事 →

AIのセーフティチェックって、テキスト単体なら弾けるのに画像と組み合わせた途端にすり抜けられたりして、運用側にとっては頭の痛い問題だったりする。NVIDIAがリリースした「Nemotron 3.5 Content Safety」は、まさにそのへんの隙をガッチリ埋めてくるモデル。企業ごとに独自のルールをセットできるようになったのがかなり大きい。

▸何が変わったのか

「Unified Multimodal Evaluation」の導入により、ユーザープロンプト、画像、AIの返答を1つのコンテキストとしてまとめて評価可能に。テキストと画像の相互作用から生じるポリシー違反を1回の推論で捕捉できる。
日本語を含む12言語での明示的学習に加え、「Gemma 3」ベースモデルの恩恵で約140言語へのゼロショット汎化をカバー。
最大のアップデートは「Custom Policy Enforcement」。ヘルスケアや金融、子ども向けアプリなど、異なるリスクに合わせて独自の安全ポリシーを適用できる。
判定に至った理由を確認できる「Reasoning Traces（THINK Mode）」も備えている。

◈前モデル / 競合との比較

前バージョンである「Nemotron 3（4Bパラメータモデル）」はマルチモーダルと多言語機能を統合した最初のステップだった。今回の3.5では、複数入力の統合評価機能に加え、カスタムポリシーの実行機能や推論プロセスの可視化（THINK Mode）が実装され、エンタープライズでの実運用によりフィットした形に進化している。

◈技術背景と意義

従来の安全フィルターは、入力されたテキストと画像を別々に判定するのが普通だった。でもそれだと、無害なテキストと画像を掛け合わせたときに初めて生まれる有害コンテキストを見逃してしまう。このモデルは複数の入力をまとめて評価することで、その抜け道を塞いでいる。
さらに、全業界に一律の基準を押し付けるのではなく、各企業が独自のルールを読み込ませて判定させられるのが画期的。判定理由までトレースできるため、コンプライアンス要件が厳しい現場でも安心して導入できるだろう。

▸こんな人・用途に

– 医療プラットフォームや金融チャットボットなど、業界特有の厳しい規制や独自のリスク基準があるサービス。
– 子ども向け教育アプリや開発者ツールIDEなど、コンテキストに応じてきめ細かい安全基準を適用したい事業者。

◆入手方法・リンク

クローズドソースモデルとして提供されており、現時点で公開されたGitHubリンク等はない。NVIDIAのプロダクション向けセーフティパイプラインに組み込んで利用することが想定されている。

公式発表を読む

SOURCE: Hugging Face (2026-06-04)

← LLM Watch トップへ

Hugging Face

Hugging Face が Model Routing Is Simple. Until It Isn’t. をリリース ── 定価が安いLLMを使うと逆に高コストになる罠
ByLLM Watch編集部 2026年7月16日

エージェントのモデルルーティングの罠を解説。キャッシュの効き方でトークン単価が安いGPT-4.1がClaude Sonnetより高コストになるという興味深い検証結果を公開。

続きを読む Hugging Face が Model Routing Is Simple. Until It Isn’t. をリリース ── 定価が安いLLMを使うと逆に高コストになる罠
OpenAI

OpenAI が Pacific Northwest National Laboratory and OpenAI partner to accelerate federal permitting をリリース ── 政府の書類仕事をAIでガチっと加速させる新ベンチマーク登場
ByLLM Watch編集部 2026年2月27日2026年3月10日

OpenAIとPNNLが政府許認可の効率化を狙う新ベンチマークを導入、15%の時間短縮へ。

続きを読む OpenAI が Pacific Northwest National Laboratory and OpenAI partner to accelerate federal permitting をリリース ── 政府の書類仕事をAIでガチっと加速させる新ベンチマーク登場
Google DeepMind

Google DeepMind がシエラレオネでのAI学習効果測定結果を公開 ── Geminiの「ソクラテス式」アプローチが効く
ByLLM Watch編集部 2026年6月9日

Google DeepMindがシエラレオネで実施した8週間のRCT結果。Geminiが答えの2%しか直接提示せず、76%で問い返す設計が功を奏した。

続きを読む Google DeepMind がシエラレオネでのAI学習効果測定結果を公開 ── Geminiの「ソクラテス式」アプローチが効く
Google DeepMind

Google DeepMind が Gemini 3.5 Flash Cyber を発表 ── 防御側に超コスパ最強の武器を
ByLLM Watch編集部 2026年7月22日

Google DeepMindがサイバーセキュリティ特化モデル「Gemini 3.5 Flash Cyber」を発表。軽量・高速モデルを活かし、低コストで脆弱性の発見と修正を爆速化する。

続きを読む Google DeepMind が Gemini 3.5 Flash Cyber を発表 ── 防御側に超コスパ最強の武器を
Hugging Face

Hugging Face × AWS が Strands Agents と LeRobot の統合を解説 ── データ収集から実機デプロイまでをひとつのエージェントで完結
ByLLM Watch編集部 2026年6月17日

AWS Strands Robots SDKとLeRobotが統合。Hubのデータセットから実機SO-101まで、ひとつのエージェントで完結するロボット開発パイプライン。

続きを読む Hugging Face × AWS が Strands Agents と LeRobot の統合を解説 ── データ収集から実機デプロイまでをひとつのエージェントで完結
Hugging Face

Hugging Face が Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries をリリース
ByLLM Watch編集部 2026年3月10日2026年3月10日

Hugging FaceのKeep the Tokens Flowing: Lessons from 16 Open-Source RL Librariesリリース情報

続きを読む Hugging Face が Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries をリリース

コメントを残すコメントをキャンセル