DiffusionGemma: 4x faster text generation カバー画像

Google DeepMind が DiffusionGemma をリリース ── 最大4倍の爆速テキスト生成を実現する拡散モデル登場

ByLLM Watch編集部 2026年6月11日

GOOGLE DEEPMIND

最終更新: 2026年06月11日 02:03　元記事 →

テキスト生成の常識がまた書き換えられそうだ。Google DeepMindが、超高速のテキスト拡散モデル「DiffusionGemma」を公開した。なんと従来のLLMと比べて最大4倍もの高速生成を実現している。1秒間に1000トークン超えって、正直かなりエグい。

▸何が変わったのか

これまでのLLMは基本的に1トークンずつ順番に文章を出力していたが、DiffusionGemmaは一気にテキストブロック全体を生成するアプローチを採用している。Gemma 4をベースにした26BのMixture of Experts (MoE) モデルで、推論時にはたった3.8Bのパラメータしか動かさない省エネ設計だ。実際に専用GPUで動かした場合、NVIDIA H100で1000+ tokens/sec、RTX 5090でも700+ tokens/secという爆速っぷりを叩き出す。しかも量子化すれば18GBのVRAMに収まるため、ハイエンドなゲーミングPCでもサクサク動く。

◈前モデル / 競合との比較

標準のGemma 4と比較すると、全体としての出力品質は低くなる。しかし、メモリ帯域から計算量へとボトルネックをシフトさせる革新的な設計により、圧倒的なスピードを実現した。最高品質の文章が必要な場合はGemma 4、超高速のインタラクティブ性が必要な場合はDiffusionGemmaという明確な住み分けがなされている。

◈技術背景と意義

従来のLLMが左から右へ言葉を紡ぐ「自己回帰」方式だったのに対し、このモデルは画像生成AIでおなじみの「拡散」の仕組みをテキストに応用している。ノイズから徐々に文章を形作るイメージで、なんと256トークンを同時に生成する仕組みだ。双方向アテンションによって文脈全体を俯瞰して自己修正できるのが面白いところ。ただし、スピードを優先した設計のため、出力品質は標準のGemma 4には及ばない。あくまで実験的な立ち位置なので、用途によって使い分ける必要がある。

▸こんな人・用途に

– リアルタイムでのインライン編集や、爆速でプロンプトを試行錯誤したい開発者向けのローカル環境
– コードの途中埋めや数学的グラフ、アミノ酸配列など、非線形な構造を扱う専門的なタスク
– 高品質な文章生成よりも、レイテンシの低さが重要視されるインタラクティブなアプリケーション

◆入手方法・リンク

Apache 2.0ライセンスで提供されるオープンモデルとしてリリースされている。詳細なリポジトリやダウンロードリンクについては、公式のアナウンスを確認する必要がある。

公式発表を読む

SOURCE: Google DeepMind (2026-06-10)

← LLM Watch トップへ

OpenAI

OpenAI が ChatGPT for operations teams を公開 ── ワークフロー最適化で業務効率を爆上げ
ByLLM Watch編集部 2026年4月14日

OpenAIが運用チーム向けにChatGPTの活用法を公開。ワークフローの合理化やプロセスの標準化など、業務効率を劇的に改善するヒントが詰まっている。

続きを読む OpenAI が ChatGPT for operations teams を公開 ── ワークフロー最適化で業務効率を爆上げ
Google DeepMind

Google DeepMind がシエラレオネでのAI学習効果測定結果を公開 ── Geminiの「ソクラテス式」アプローチが効く
ByLLM Watch編集部 2026年6月9日

Google DeepMindがシエラレオネで実施した8週間のRCT結果。Geminiが答えの2%しか直接提示せず、76%で問い返す設計が功を奏した。

続きを読む Google DeepMind がシエラレオネでのAI学習効果測定結果を公開 ── Geminiの「ソクラテス式」アプローチが効く
OpenAI

OpenAI が ChatGPT に Projects 機能を追加 ── 散らかった会話をスッキリ整理
ByLLM Watch編集部 2026年4月11日

ChatGPTにProjects機能が追加。チャット・ファイル・指示をプロジェクト単位で整理でき、作業管理が劇的にラクになる待望のアップデート。

続きを読む OpenAI が ChatGPT に Projects 機能を追加 ── 散らかった会話をスッキリ整理
OpenAI

OpenAI が GPT-5.5 を公開 ── Databricksのエージェントワークフローで新SOTA達成
ByLLM Watch編集部 2026年5月16日2026年5月16日

DatabricksがエンタープライズのエージェントワークフローにGPT-5.5を導入。OfficeQA Proベンチマークで新たな最高水準（SOTA）を達成したと発表。

続きを読む OpenAI が GPT-5.5 を公開 ── Databricksのエージェントワークフローで新SOTA達成
OpenAI

OpenAI が Improving health intelligence in ChatGPT をリリース ── 医師の目線を取り入れた健康アドバイスがついに進化
ByLLM Watch編集部 2026年6月19日

OpenAIがGPT-5.5 Instantを活用し、ChatGPTの健康アドバイス機能を大幅向上。医師の知見を取り入れた評価プロセスで回答の質が劇的に進化。

続きを読む OpenAI が Improving health intelligence in ChatGPT をリリース ── 医師の目線を取り入れた健康アドバイスがついに進化
Google DeepMind

Google DeepMind が Gemini Robotics-ER 1.6 をリリース ── 自律的ロボティクスのため空間推論能力を強化
ByLLM Watch編集部 2026年4月15日2026年4月15日

Google DeepMindが自律型ロボット向けモデル「Gemini Robotics-ER 1.6」を発表。空間推論と多視点理解を強化し、複雑な現実世界のタスクに対応する。

続きを読む Google DeepMind が Gemini Robotics-ER 1.6 をリリース ── 自律的ロボティクスのため空間推論能力を強化

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

◆入手方法・リンク

類似投稿

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル