Decoupled DiLoCo: A new frontier for resilient, distributed AI training カバー画像

Google DeepMind が Decoupled DiLoCo: A new frontier for resilient, distributed AI training をリリース ── 地球規模の分散学習がさらに頑健に

Byren_admin 2026年4月24日

GOOGLE DEEPMIND

最終更新: 2026年04月24日 00:03　元記事 →

世界中のデータセンターを繋いで一つの巨大AIを学習させる──。その構想に向けたとんでもない一歩をGoogle DeepMindが踏み出した。物理的な距離の壁やハードウェアの故障に阻まれず、システムが自己修復しながら学習を続ける仕組みがついに現実のものに。これはかなり熱い。

▸何が変わったのか

今回発表された「Decoupled DiLoCo」は、大規模な学習プロセスを「islands（島）」と呼ぶ計算単位に分割する新しいアーキテクチャ。各「島」は非同期でやり取りを行うため、一部のチップが故障しても他の学習プロセスは止まらない。実際に「chaos engineering」を用いて意図的なハードウェア障害を起こすテストでも、システムは学習を継続し、復旧後にシームレスな再統合を果たした。Gemma 4モデルでの実証実験でも、従来のクラスターよりも高い可用性を維持している。

◈前モデル / 競合との比較

従来のData-Parallel（データ並列）アプローチは、グローバルスケールでの通信遅延がボトルネックとなり実用的ではなかった。しかし今回のアーキテクチャは非同期通信を採用したことでその問題を回避。さらに障害発生時のシステム全体の可用性も大きく引き上げている。

◈技術背景と意義

AIのモデルが巨大化するにつれて、何万もの計算チップをピッタリと同期させるのが物理的に限界を迎えつつある。そこでGoogleは以前、非同期データフローの「Pathways」と、通信量を劇的に削減する「DiLoCo」を開発。今回の「Decoupled DiLoCo」はこれらの技術を統合したものだ。各拠点のグループが独立して計算し、結果だけをやり取りする仕組みにより、地球の裏側にあるデータセンターの通信遅延やマシントラブルを気にせず巨大なモデルを育てられる。

▸こんな人・用途に

地理的に離れた複数のデータセンターをまたいで、一つのフロンティアモデルを学習させる巨大プロジェクト。ネットワーク帯域を節約しつつ、安定した大規模LLMのトレーニングを行いたい企業や研究機関。

◆入手方法・リンク

詳細はGoogle DeepMindの公式ブログおよび関連論文で確認できる。ソースコードの公開は現時点でなし。

公式発表を読む

SOURCE: Google DeepMind (2026-04-22)

← LLM Watch トップへ

OpenAI

OpenAI が What is Codex? をリリース ── チャットを超えて自律的にタスクをこなすエージェント
Byren_admin 2026年4月24日

OpenAIのCodexはチャットを超え、タスク自動化とツール連携で実際の成果物を生成するエージェント型AI。

続きを読む OpenAI が What is Codex? をリリース ── チャットを超えて自律的にタスクをこなすエージェント
OpenAI

OpenAI が Codex Security: now in research preview をリリース ── 脆弱性の検知からパッチまで自動化するAIエージェント登場
Byren_admin 2026年3月7日2026年3月10日

OpenAIが「Codex Security」の研究プレビューを開始。脆弱性の検知から修正までを行うAIエージェントです。

続きを読む OpenAI が Codex Security: now in research preview をリリース ── 脆弱性の検知からパッチまで自動化するAIエージェント登場
Hugging Face

Hugging Face が Granite 4.0 1B Speech: Compact, Multilingual, and Built for the Edge をリリース ── パラメータ半減で日本語対応も実現した小型音声モデル
Byren_admin 2026年3月10日2026年3月10日

Granite 4.0 1B Speech登場。パラメータ半減で精度向上と日本語対応を実現。

続きを読む Hugging Face が Granite 4.0 1B Speech: Compact, Multilingual, and Built for the Edge をリリース ── パラメータ半減で日本語対応も実現した小型音声モデル
OpenAI

OpenAI が How Balyasny Asset Management built an AI research engine for investing をリリース ── GPT-5.4を使った投資分析エンジンが登場
Byren_admin 2026年3月7日2026年3月10日

OpenAIがGPT-5.4を使った投資AIの構築事例を紹介

続きを読む OpenAI が How Balyasny Asset Management built an AI research engine for investing をリリース ── GPT-5.4を使った投資分析エンジンが登場
Hugging Face

Hugging Face が Holo3 をリリース ── OSWorldでSOTA獲得、アクティブ10B参数でGPT-5.4超えの衝撃
Byren_admin 2026年4月2日

Hugging Faceが発表したPC操作エージェント「Holo3」がOSWorldで78.85%を記録。わずか10BのアクティブパラメータでGPT 5.4を凌駕する驚異の性能。

続きを読む Hugging Face が Holo3 をリリース ── OSWorldでSOTA獲得、アクティブ10B参数でGPT-5.4超えの衝撃
OpenAI

OpenAI が GPT-5.4 をリリース ── 最強コーディング能力と100万トークンを実装
Byren_admin 2026年3月6日2026年3月10日

OpenAIがGPT-5.4発表。プロ向け最強モデルで100万トークンと最先端コーディング。

続きを読む OpenAI が GPT-5.4 をリリース ── 最強コーディング能力と100万トークンを実装

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

◆入手方法・リンク

類似投稿

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル