Task-Seeded Synthetic Q&A Generation for Nemotron Pretraining カバー画像

Hugging Face

NVIDIA が Nemotron 向け合成Q&A生成手法を公開 ── GPQAで+11.1の劇的改善

ByLLM Watch編集部 2026年6月4日

HUGGING FACE

最終更新: 2026年06月04日 21:02　元記事 →

LLMの学習データって、量より質――って言われるけど、具体的にどう質を上げるのか。NVIDIAがNemotronシリーズの学習で使ってる「Task-Seeded Synthetic Q&A Generation」の中身を詳しく解説していて、これがかなり参考になる。特にGPQA（専門職レベルの難問ベンチマーク）で+11.1って数字は正直すごい。

▸何が変わったのか

公開タスクのトレーニングデータを「種」にして、類似問題と理由付き回答を合成生成するパイプライン。約70タスク・約700サブタスクを網羅。Nemotron-3 Nanoでの100Bトークン継続実験で、MMLU-Pro +1.8、average code +1.9、commonsense understanding +1.6、GPQA +11.1を達成。数学スコアは安定を維持。スキーマチェック、フォーマットチェック、重複排除、多数決回答チェックで品質を担保。評価用データは生成に使わない設計で、テスト漏洩を防止。

◈技術背景と意義

LLMにテキストを大量に読ませるだけじゃ、賢くならない。問題と回答のペアを構造化された形で学ぶ必要がある。この手法は既存のタスクデータから「似た問題」を人工的に作り出し、回答に理由や関連知識を付与してから学習に使う仕組み。要するに「良質な例題を大量に生成してから勉強させる」というアプローチ。数学を大量に解くだけでなく、解法の思考プロセスも一緒に学ぶ感じ。

◆入手方法・リンク

記事はHugging Faceのブログで公開中。パイプライン自体はクローズドソースで、コードの公開は現時点ではない。

公式発表を読む

SOURCE: Hugging Face (2026-06-04)

← LLM Watch トップへ

Hugging Face

Hugging Face が「MosaicLeaks」を発表 ── AIエージェントのWeb検索で社外秘が漏れる、恐怖のモザイク効果
ByLLM Watch編集部 2026年6月19日

Deep ResearchエージェントのWeb検索クエリから社外秘が漏れる「モザイク効果」と、漏洩を9.9%に抑える訓練手法PA-DRを提案する研究。

続きを読む Hugging Face が「MosaicLeaks」を発表 ── AIエージェントのWeb検索で社外秘が漏れる、恐怖のモザイク効果
Hugging Face

NVIDIAがコード学習データ「Code Concepts」を公開 ── 概念ベースの合成で効率化
ByLLM Watch編集部 2026年3月12日

NVIDIAが概念駆動型の合成データ生成手法を公開、1500万問でコードAIを強化

続きを読む NVIDIAがコード学習データ「Code Concepts」を公開 ── 概念ベースの合成で効率化
OpenAI

OpenAI が Nextdoor における Codex 活用事例を公開 ── 再現困難なバグ調査を GPT-5.5 で解決
ByLLM Watch編集部 2026年6月10日

NextdoorのエンジニアがCodexとGPT-5.5を活用し、再現困難なバグ調査を効率化。マルチプラットフォーム開発で成果に集中する事例。

続きを読む OpenAI が Nextdoor における Codex 活用事例を公開 ── 再現困難なバグ調査を GPT-5.5 で解決
OpenAI

OpenAI が Running Codex safely at OpenAI を公開 ── コーディングエージェントを安全に走らせる仕組み
ByLLM Watch編集部 2026年5月9日

OpenAIがCodexの安全な運用方法を公開。サンドボックス、承認フロー、ネットワークポリシー、テレメトリでコンプライアンス対応のコーディングエージェントを実現。

続きを読む OpenAI が Running Codex safely at OpenAI を公開 ── コーディングエージェントを安全に走らせる仕組み
Google DeepMind

Google DeepMind が Nano Banana 2 Lite と Gemini Omni Flash をリリース ── 画像生成4秒＆動画の編集も会話で完結
ByLLM Watch編集部 2026年7月1日

Google DeepMindが、4秒で画像生成＆1K枚0.034ドルの「Nano Banana 2 Lite」と動画編集モデル「Gemini Omni Flash」をリリース。

続きを読む Google DeepMind が Nano Banana 2 Lite と Gemini Omni Flash をリリース ── 画像生成4秒＆動画の編集も会話で完結
Hugging Face

NVIDIAエンジニアが Gemma 4 VLA Demo on Jetson Orin Nano Super を公開 ── 8GBエッジデバイスで動く自律判断AIアシスタント
ByLLM Watch編集部 2026年4月23日

Jetson Orin Nano Super(8GB)上でGemma 4が文脈に応じて自発的にカメラ使用を判断するVLAデモが公開

続きを読む NVIDIAエンジニアが Gemma 4 VLA Demo on Jetson Orin Nano Super を公開 ── 8GBエッジデバイスで動く自律判断AIアシスタント

コメントを残すコメントをキャンセル