OpenAI

OpenAI が「Where the goblins came from」を公開 ── GPT-5の奇妙なクセの裏側

ByLLM Watch編集部 2026年4月30日

OPENAI

最終更新: 2026年04月30日 13:03　元記事 →

AIが突然、奇妙な口調になったり、予測不能な言動を繰り返したりする現象に遭遇したことはないだろうか。OpenAIが最近公開した「Where the goblins came from」というトピックは、まさにその謎に切り込む内容で、個人的にめちゃくちゃ興味をそそられた。

▸何が変わったのか

今回焦点を当てられているのは、AIモデル内で広がる「goblin outputs」と呼ばれる現象の解明だ。提供テキストによると、GPT-5の振る舞いに見られる「personality-driven quirks（パーソナリティ駆動の癖）」について、そのタイムラインや根本的な原因が語られている。さらに、その奇妙な挙動をどう修正したか（fixes）についても言及。具体的な数値は明かされていないが、ブラックボックス化しやすいAIの内部動作に踏み込んだ興味深いアプローチだ。

◈技術背景と意義

高度なAIモデルは学習の過程で、時に人間のような「性格」のようなものを獲得することがある。それが意図せず「ゴブリン」のような奇妙な出力として表に出てしまう現象は、学習データの偏りや報酬モデルの過学習が原因とされている。AIの規模が大きくなるほど、こうした予期せぬクセの制御は至難の業だ。OpenAIがそのメカニズムと修正プロセスをどう捉えているのか、開発者でなくてもワクワクする話題だ。

◆入手方法・リンク

現状、OSSとしての公開やGitHubリンク、実測ベンチマークはなし。OpenAI公式のドキュメントや発表として詳細を確認する形になる。

公式発表を読む

SOURCE: OpenAI (2026-04-30)

← LLM Watch トップへ

Google DeepMind

Google DeepMind が医療の新モデル「AI co-clinician」を発表 ── 医師の「同僚」を目指す構想
ByLLM Watch編集部 2026年5月1日

Google DeepMindが、医師の『同僚』として機能するAI共同臨床医の開発と、AI拡張医療の実現に向けた研究を発表した。

続きを読む Google DeepMind が医療の新モデル「AI co-clinician」を発表 ── 医師の「同僚」を目指す構想
Hugging Face

Hugging Face が The Open Agent Leaderboard をリリース ── モデルじゃなく「エージェント全体」を評価する新基準
ByLLM Watch編集部 2026年5月19日

Hugging Faceがエージェントシステム全体を評価するOpen Agent Leaderboardを公開。品質もコストも見える化する新しいベンチマーク。

続きを読む Hugging Face が The Open Agent Leaderboard をリリース ── モデルじゃなく「エージェント全体」を評価する新基準
Hugging Face

Hugging Face が Unlocking asynchronicity in continuous batching を解説 ── GPUの待ち時間を削る非同期アプローチ
ByLLM Watch編集部 2026年5月15日

Hugging Faceが非同期バッチングでGPU利用率を最大化する手法を解説。CPU・GPU並列動作で約25%のアイドル時間を削減。

続きを読む Hugging Face が Unlocking asynchronicity in continuous batching を解説 ── GPUの待ち時間を削る非同期アプローチ
OpenAI

OpenAI が How Ramp engineers accelerate code review with Codex をリリース ── GPT-5.5を活用しレビューを数分に短縮
ByLLM Watch編集部 2026年5月21日

OpenAIがRamp社のエンジニアによるCodexとGPT-5.5を活用したコードレビュー事例を公開。数時間かかっていたフィードバックが数分に。

続きを読む OpenAI が How Ramp engineers accelerate code review with Codex をリリース ── GPT-5.5を活用しレビューを数分に短縮
OpenAI

OpenAI が How Cars24 scales conversations and builds faster with OpenAI を公開 ── 月間100万分会話をこなすAIエージェントの実力
ByLLM Watch編集部 2026年7月17日

中古車プラットフォームのCars24がOpenAIを導入し、月間100万分会話を処理しつつ見込み客の12%回復を実現した事例を解説。

続きを読む OpenAI が How Cars24 scales conversations and builds faster with OpenAI を公開 ── 月間100万分会話をこなすAIエージェントの実力
Hugging Face

Hugging Face が Introducing Real World VoiceEQ: Measuring the human quality of voice AI をリリース ── 既存ベンチマークでは測れない「人間らしさ」を評価する新指標
ByLLM Watch編集部 2026年7月15日

音声AIの「人間らしさ」を測る新ベンチマーク「Real World VoiceEQ」。100万件以上の人間の評価データに基づき、感情やトーンなど従来指標では測れなかった領域を評価する。

続きを読む Hugging Face が Introducing Real World VoiceEQ: Measuring the human quality of voice AI をリリース ── 既存ベンチマークでは測れない「人間らしさ」を評価する新指標

コメントを残すコメントをキャンセル