NVIDIA が Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI をリリース ── 企業独自の安全ポリシーを適用できるマルチモーダルガードモデル
AIのセーフティチェックって、テキスト単体なら弾けるのに画像と組み合わせた途端にすり抜けられたりして、運用側にとっては頭の痛い問題だったりする。NVIDIAがリリースした「Nemotron 3.5 Content Safety」は、まさにそのへんの隙をガッチリ埋めてくるモデル。企業ごとに独自のルールをセットできるようになったのがかなり大きい。
▸何が変わったのか
「Unified Multimodal Evaluation」の導入により、ユーザープロンプト、画像、AIの返答を1つのコンテキストとしてまとめて評価可能に。テキストと画像の相互作用から生じるポリシー違反を1回の推論で捕捉できる。
日本語を含む12言語での明示的学習に加え、「Gemma 3」ベースモデルの恩恵で約140言語へのゼロショット汎化をカバー。
最大のアップデートは「Custom Policy Enforcement」。ヘルスケアや金融、子ども向けアプリなど、異なるリスクに合わせて独自の安全ポリシーを適用できる。
判定に至った理由を確認できる「Reasoning Traces(THINK Mode)」も備えている。
◈前モデル / 競合との比較
前バージョンである「Nemotron 3(4Bパラメータモデル)」はマルチモーダルと多言語機能を統合した最初のステップだった。今回の3.5では、複数入力の統合評価機能に加え、カスタムポリシーの実行機能や推論プロセスの可視化(THINK Mode)が実装され、エンタープライズでの実運用によりフィットした形に進化している。
◈技術背景と意義
従来の安全フィルターは、入力されたテキストと画像を別々に判定するのが普通だった。でもそれだと、無害なテキストと画像を掛け合わせたときに初めて生まれる有害コンテキストを見逃してしまう。このモデルは複数の入力をまとめて評価することで、その抜け道を塞いでいる。
さらに、全業界に一律の基準を押し付けるのではなく、各企業が独自のルールを読み込ませて判定させられるのが画期的。判定理由までトレースできるため、コンプライアンス要件が厳しい現場でも安心して導入できるだろう。
▸こんな人・用途に
– 医療プラットフォームや金融チャットボットなど、業界特有の厳しい規制や独自のリスク基準があるサービス。
– 子ども向け教育アプリや開発者ツールIDEなど、コンテキストに応じてきめ細かい安全基準を適用したい事業者。
◆入手方法・リンク
クローズドソースモデルとして提供されており、現時点で公開されたGitHubリンク等はない。NVIDIAのプロダクション向けセーフティパイプラインに組み込んで利用することが想定されている。
SOURCE: Hugging Face (2026-06-04)

