OpenAI が What Parameter Golf taught us about AI-assisted research を発表 ── AIに研究させまくると何がわかるか
AIに機械学習の研究を任せたらどこまでできるのか。OpenAIがそんな大規模な実験の結果をまとめたレポートを公開した。1000人以上が参加して繰り広げられたこの取り組み、単なるお遊びじゃ済ませられない面白い知見が詰まっている。
▸何が変わったのか
今回のレポートは「Parameter Golf」という、厳格な制約下でAIを使った機械学習の研究を探求するプロジェクトのまとめ。具体的には「1,000以上の参加者」が集結し、「2,000以上のサブミッション」が投稿された。ターゲットになったのは、AIを活用した機械学習研究、コーディングエージェント、量子化(モデルの軽量化)、そして新しいモデルの設計。参加者がしのぎを削ってAIのサポートを受けながら限界に挑んだ熱い戦いの記録だ。
◈技術背景と意義
「Parameter Golf」とは、パラメータ数などに厳しい制限を設けた中で、どれだけ優れた性能を引き出せるかを競うコンテスト。今回はそこにAIを持ち込んで、人間とAIが協力しながら課題を解くアプローチが試された。普段は人間が手作業で設計したり調整したりするモデル構築やコーディングをAIエージェントに任せたりして、AIの研究支援が実用レベルでどこまで通用するのかを検証している。正直、これからの開発の進め方を占う上でかなりエキサイティングな内容だ。
▸こんな人・用途に
AIエージェントを使った研究自動化やコーディング支援の限界を知りたい機械学習エンジニア。モデルの軽量化(量子化)や新型モデル設計の最前線の知見を求める研究者。
▸Redditの反応
新しいオプティマイザRoseに対しては「証拠が薄い」と懐疑的な声が目立つ。一方、SSMの限界を検証したスレでは「ネガティブ結果こそ面白い」と技術議論が活発に。
「学習ログは45行も並べてるのに、肝心の更新ルールがどこにも書いてないの?そこ一番知りたいところなんだけど。」
「MNISTでAdamWと比較してるけど、単一シードの1回だけ?最大の差が0.04%って…複数回の実験でちゃんと検証してる?」
「これってAIリサーチエンジンが自動生成した投稿なの?🌹🤷🤖の絵文字の組み合わせがいかにもAIっぽくて怪しい。」
「個人的にこういう「うまくいかなかった結果」が一番面白い。いつものAI過大宣伝みたいなノイズが少ないし、好き。」
「圧縮がボトルネックになるの面白い。LZMAのパフォーマンスが重み分布で変わるとか考えたことなかった。SP4096→8192の反転はヤバい。」
◆入手方法・リンク
今回のレポートはクローズドソースの発表であり、関連するGitHubリポジトリは公開されていない。詳細はOpenAIの公式ブログや関連ドキュメントから直接確認してほしい。
SOURCE: OpenAI (2026-05-12)