Hugging Face が Thousand Token Wood を紹介 ── 3Bモデルで森の経済シミュレーションを動かす実験
3Bモデルでマルチエージェントの経済シミュレーションを動かす──。Build Small Hackathonに提出されたこのプロジェクトは、Qwen2.5-3Bを5つの森の生き物エージェントに割り当て、取引・ゴシップ・備蓄・パニックを引き起こす仕組み。小さなモデルでリアルタイムな経済の泡や暴落を再現できるのか、その結果は非常に興味深い。
▸何が変わったのか
Qwen2.5-3Bを使って5つの森の生き物エージェントが5種類の財を「小石(pebbles)」と取引する経済シミュレーションを構築。vLLM on Modalでモデルをサーブし、Gradioアプリで可視化している。初期バージョンは生産が消費を上回り誰も取引しない「死んだ経済」だったが、食事の多様性(1種類の食料は1食につき1単位しか食べられない)、腐敗(備蓄すると腐る)、冬の燃料危機(薪を作れるのは1体のみ)という「意図的な希少性」を設計することで解決。3Bモデルは100%の確率で有効なJSONを出力したものの、経済的判断は乏しく、自分が余らせているドングリを買おうとするミスが発生。プロンプトで各エージェントの生産物と不足品を明示し、ワーク例を1つ与えることで判断品質が向上した。
◈前モデル / 競合との比較
提供テキスト内で明確な比較はありません。ただしフロンティアモデル(巨大なLLM)との対比として、速度とコストの面で3Bモデルが有利であることが言及されています。フロンティアモデルは「毎ターン理事会を開くには遅すぎて高すぎる」一方、3Bモデルは全エージェントの意思決定を1回のバッチGPU呼び出しで処理できる点が明確な差別化要因です。
◈技術背景と意義
マルチエージェントシミュレーションでは多数のエージェントが毎ターン何度も意思決定を行う必要がある。フロンティアモデル(巨大なLLM)は遅くて高コストなので、この用途には不向き。3Bモデルなら全エージェントの意思決定を1回のバッチGPU呼び出しで処理でき、リアルタイムシミュレーションが現実的なものになる。ただし3Bモデルは「フォーマット生成器」としては優秀でも「推論器」としては心もとない。そのギャップを埋めるのがプロンプト設計と寛容なJSONパーサーで、うまく組めば小さなモデルでも魅力的な創発現象を引き出せる。
▸こんな人・用途に
マルチエージェントシミュレーションのプロトタイピング──少数のエージェントで経済力学や創発現象を素早く検証したい場合に最適。小規模LLMの限界と可能性を探る実験──フォーマット生成と推論の差を体感できる教材としても機能する。経済システムの設計学習──希少性の設計がなぜ重要かを、バブルや暴落が自然発生するシミュレーションで直感的に理解できる。
◆入手方法・リンク
Hugging Face Spaceでブラウザから直接試せる。またagent traces(エージェントの思考ログ)も公開されている。ソースコードはクローズドソースでGitHubリポジトリの公開はなし。
SOURCE: Hugging Face (2026-06-05)
