MosaicLeaks: Can your research agent keep a secret? カバー画像

Hugging Face が「MosaicLeaks」を発表 ── AIエージェントのWeb検索で社外秘が漏れる、恐怖のモザイク効果

Byren_admin 2026年6月19日

HUGGING FACE

最終更新: 2026年06月19日 04:02　元記事 →

社内文書を読み込ませたリサーチエージェントが、裏でコソコソWeb検索してませんか。MosaicLeaksが指摘するのは、その検索クエリの組み合わせから企業の秘密が復元されてしまうという恐ろしいリスクだ。しかも、タスク性能を高める訓練をすればするほど漏洩が悪化するという結果まで出ていて、これは正直かなりやばい。

▸何が変わったのか

MosaicLeaksは、公開情報と非公開情報が交錯するmulti-hop質問を用いた新しいDeep Researchタスクを提案。テストした全モデルでエージェントが頻繁にプライベート情報を漏洩し、タスク性能のみを最適化する訓練だと漏洩がさらに悪化するという結果に。著者らはこれに対抗し、Privacy-Aware Deep Research（PA-DR）というmosaic-leakage-aware RL訓練手法を提案している。PA-DRの効果は明確で、strict chain success（全hopで正解した連鎖の割合）が48.7%から58.7%に向上しつつ、answer/full-information leakageが34.0%から9.9%へ大幅減少。性能を上げながらプライバシーも守れる、両立の方向性をデータで示している。

◈前モデル / 競合との比較

従来のタスク性能のみを最適化した訓練では、エージェントの外部クエリ経由での情報漏洩が悪化する一方だった。PA-DR訓練を適用することで、strict chain successは48.7%→58.7%に向上しつつ、answer/full-information leakageは34.0%→9.9%に減少。「性能かプライバシーか」のトレードオフを打破できる点が鍵になる。

◈技術背景と意義

ヘルスケア企業のリサーチエージェントを例に考えよう。社内文書にしか存在しない「MediConn社は2025年1月までにインフラの70%をクラウド移行した」という事実があるとする。エージェントはこれを直接出力しないけど、「クラウド移行のマイルストーン」「2024年1月のセキュリティ開示」「どのベンダーが被害に遭ったか」といった複数のWeb検索を発火させる。単体では無害に見える検索ログでも、外部の攻撃者が全部つなぎ合わせれば非公開情報が復元できてしまう。これが「モザイク効果」。しかも攻撃者は社内文書やエージェントの推論プロセスを見る必要がなく、累積のクエリログだけで済むのが恐ろしいところだ。

▸こんな人・用途に

企業内でDeep Researchエージェントの導入を検討しているセキュリティ担当者やCTO。医療・金融など機密性の高いドメインでAIを活用する組織の情報システム部門。プライバシー保護を考慮したエージェント設計に関心がある研究者・エンジニア。

◆入手方法・リンク

本記事はHugging Faceのブログ記事として2026年6月18日に公開。モデルやコードの公開は現時点ではなく、クローズドソース。GitHubリンク等の提供もなし。

公式発表を読む

SOURCE: Hugging Face (2026-06-18)

← LLM Watch トップへ

Hugging Face

Hugging Face が OpenAI の Privacy Filter を活用したアプリ構築法を公開 ── 128kコンテキストを一発スキャンするPII検出モデルの実力
Byren_admin 2026年4月28日

OpenAIの1.5BパラメータPII検出モデル「Privacy Filter」を使ったスケーラブルなWebアプリ構築チュートリアルが公開。

続きを読む Hugging Face が OpenAI の Privacy Filter を活用したアプリ構築法を公開 ── 128kコンテキストを一発スキャンするPII検出モデルの実力
OpenAI

OpenAI が GPT-5.5 をリリース ── 史上最速・最高性能の新モデルが登場
Byren_admin 2026年4月24日2026年4月26日

OpenAIがGPT-5.5をリリース。史上最もスマートなモデルで、コーディング・リサーチ・データ分析に強い。

続きを読む OpenAI が GPT-5.5 をリリース ── 史上最速・最高性能の新モデルが登場
Google DeepMind

Google DeepMind が DiffusionGemma をリリース ── 最大4倍の爆速テキスト生成を実現する拡散モデル登場
Byren_admin 2026年6月11日

Google DeepMindがテキスト拡散モデルDiffusionGemmaをリリース。H100で1000+ tokens/secを叩き出す超高速モデル。

続きを読む Google DeepMind が DiffusionGemma をリリース ── 最大4倍の爆速テキスト生成を実現する拡散モデル登場
OpenAI

OpenAI が Rosalind Biodefense を立ち上げ ── GPT-Rosalind でバイオ防御・パンデミック対策を本格推進
Byren_admin 2026年5月29日

OpenAIがバイオ防御・パンデミック対策に特化したRosalind Biodefenseを立ち上げ、審査済み開発者と米政府パートナーにGPT-Rosalindのアクセスを拡大した。

続きを読む OpenAI が Rosalind Biodefense を立ち上げ ── GPT-Rosalind でバイオ防御・パンデミック対策を本格推進
OpenAI

OpenAI が How Balyasny Asset Management built an AI research engine for investing をリリース ── GPT-5.4を使った投資分析エンジンが登場
Byren_admin 2026年3月7日2026年3月10日

OpenAIがGPT-5.4を使った投資AIの構築事例を紹介

続きを読む OpenAI が How Balyasny Asset Management built an AI research engine for investing をリリース ── GPT-5.4を使った投資分析エンジンが登場
Hugging Face

Hugging Face が The Rise of Physical AI for Healthcare Robotics を公開 ── 医療ロボットのための「物理AI」が本格始動
Byren_admin 2026年3月17日

医療ロボット用データ「Open-H-Embodiment」登場。778時間の手術・超音波データを公開。

続きを読む Hugging Face が The Rise of Physical AI for Healthcare Robotics を公開 ── 医療ロボットのための「物理AI」が本格始動

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

◆入手方法・リンク

類似投稿

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル