OpenAI

OpenAI が A shared playbook for trustworthy third party evaluations をリリース ── フロンティアモデルの第三者評価をどう行うか指南

ByLLM Watch編集部 2026年5月30日

OPENAI

最終更新: 2026年05月30日 09:02　元記事 →

AIモデルの危険性や安全性を外部機関がどうチェックすべきか──OpenAIがそのガイドラインを自ら公開した。最先端のAIがブラックボックス化する中、外部評価のルールを明確にしようという動きは素直に歓迎したい。

▸何が変わったのか

OpenAIがサードパーティによるAI評価のガイダンスを公開。対象は最先端の「フロンティアシステム」。具体的には「モデルの能力」「セーフガード（安全装置）」「有効性」をどう評価すべきかというポイントを網羅している。自社モデルを外部機関がチェックする際の共通認識を作る狙いだ。

◈技術背景と意義

最先端のAIは、開発元ですらすべての挙動を把握しきれないほど複雑化している。だから、独立した外部機関が安全性をテストする「サードパーティ評価」がめちゃくちゃ重要になる。今回のプレイブックは、外部の評価者が「何を・どうテストすべきか」という共通の指針を提示するもの。評価の透明性と信頼性を高めるための第一歩と言える。

▸こんな人・用途に

・AIモデルの安全性を検証する独立した研究機関や監査団体
・自社導入するAIのリスクを客観的に把握したい企業のセキュリティ担当者

◆入手方法・リンク

本ガイダンスはOpenAIの公式ブログにて公開されている。GitHub等の公開リポジトリは現在設けられていない。

公式発表を読む

SOURCE: OpenAI (2026-05-30)

← LLM Watch トップへ

Hugging Face

Hugging Face 発の新ツール「Her · हेर」がリリース ── Claude Codeの暴走を調査する「探偵」
ByLLM Watch編集部 2026年6月7日

Claude Codeの.jsonlセッションログを解析し、エージェントの挙動やトークン消費、リスクの高い操作を特定するツール「Her · हेर」が登場した。

続きを読む Hugging Face 発の新ツール「Her · हेर」がリリース ── Claude Codeの暴走を調査する「探偵」
OpenAI

OpenAI が How Preply combines AI and human tutors to personalize learning をリリース ── AIと人間の講師が融合する語学学習
ByLLM Watch編集部 2026年6月14日

PreplyがOpenAIを活用し、AI生成のレッスンサマリーやパーソナライズされたフィードバック、学習課題を自動提供する新機能をリリース。

続きを読む OpenAI が How Preply combines AI and human tutors to personalize learning をリリース ── AIと人間の講師が融合する語学学習
Hugging Face

Hugging Face が「LoRAを超える手法はあるか」を公開 ── PEFTの世界は本当にLoRA一強なのか？
ByLLM Watch編集部 2026年6月19日

Hugging Faceが「LoRA一強で本当にいいのか？」を問う記事を公開。HubのPEFTモデル98.4%がLoRA使用という圧倒的シェアを示しつつ、他手法の検討を促している。

続きを読む Hugging Face が「LoRAを超える手法はあるか」を公開 ── PEFTの世界は本当にLoRA一強なのか？
Hugging Face

Hugging Face が NVIDIA Cosmos 3 をリリース ── 物理AIのための統合オムニモデル登場
ByLLM Watch編集部 2026年6月1日

NVIDIA Cosmos 3は物理AI向けオムニモデル。MoT採用で生成・推論・アクションを1モデルに統合。Hugging Faceで公開中。

続きを読む Hugging Face が NVIDIA Cosmos 3 をリリース ── 物理AIのための統合オムニモデル登場
OpenAI

OpenAI が Working with Codex をリリース ── Codexを使いこなす公式ガイド登場
ByLLM Watch編集部 2026年4月24日

OpenAIがCodex公式ガイドを公開。workspace構築からプロジェクト管理まで丁寧に解説。

続きを読む OpenAI が Working with Codex をリリース ── Codexを使いこなす公式ガイド登場
Google DeepMind

Google DeepMind が Gemini 3.6 をリリース ── エージェント構築のための究極のコスパと効率
ByLLM Watch編集部 2026年7月22日

Google DeepMindがエージェント向けに最適化したGemini 3.6 Flashなどをリリース。出力トークンを大幅削減しつつ低価格化を実現。

続きを読む Google DeepMind が Gemini 3.6 をリリース ── エージェント構築のための究極のコスパと効率

コメントを残すコメントをキャンセル