Hugging Face が State of Open Source on Hugging Face: Spring 2026 をリリース ── モデル数200万突破の衝撃
ついにHugging Face上の公開モデル数が200万個を突破したらしいです。2025年の間にユーザー数やデータセットもほぼ倍増していて、この成長ペースはもはや凄勢というより嵐ですね。単にモデルを利用するだけでなく、みんなガンガン独自の派生モデルを作り始めているのが現状のようです。
▸何が変わったのか
2025年時点でユーザー数は1100万人、公開モデルは200万個を超え、公開データセットも50万個以上に到達しました。モデルの利用状況にはかなり偏りがあり、全ダウンロード数の49.6%を、わずか上位200モデル(全体の0.01%)が占めているという現実も明らかに。逆に、約半数のモデルはダウンロード数が200未満ですが、特定のドメインや言語に特化したコミュニティ内では活発な活動が見られています。Fortune 500企業の30%以上がアカウントを維持するなど、企業活用も明らかに加速しています。
◈前モデル / 競合との比較
前回の2025年半ばの分析と比較して、ユーザーやモデル、データセットの数が急速にほぼ倍増している点が最大の変化。以前は既存のシステムを消費するユーザーが多かったのが、今回は派生モデルやアプリを作成する能動的な参加者へと態勢が大きく変化しています。
◈技術背景と意義
以前はオープンソースのモデルをそのまま使う「消費」が主流でしたが、今はファインチューニングやアダプター作成など、自分たちで手を加える「参加」型へとエコシステムがシフトしています。特定の目的に特化した小さなコミュニティが重要視され始めており、オープンソースAIは単一の市場ではなく、重なり合う複数のサブエコシステムの集合体として理解するのが正解です。Big Tech企業だけでなく、Airbnbのような既存企業やThinking Machinesのようなスタートアップも、オープンな重みをベースに構築する流れが当たり前になりつつあるんですね。
▸こんな人・用途に
Thinking MachinesがTinkerモデルのオプションを完全にオープンな重みで構築しているスタートアップの事例。VSCodeやCursorといった人気IDEがオープンモデルとクローズドモデルの両方をサポートしている開発環境。Airbnbのようなアメリカの大手企業がオープンエコシステムへの関与を深めている企業活用。
▸Redditの反応
スコアは低めで、爆発的な盛り上がりというよりは実務的な視点からのコメントが目立つ感じ。「デモと本番は別物」という慎重な意見や、具体的な導入方法を探る質問など、技術者らしいリアルな声が上がっています。
「リモートのデータベースでも動くの?自分でDBを構築しないと使えないってことかな。でもこれ、今進めてるプロジェクトですごく役立ちそうな予感がするんだ。」
「NL2SQLを本番環境で動かすのはデモとは大違いだよ。スキーマの注入方法が重要で、DDLを全部コンテキストに詰め込むと、現実的なDBならすぐトークン制限に引っかかっちゃう。」
◆入手方法・リンク
今回の分析レポートはHugging Faceの公式ブログページで公開されています。2025年半ばの以前の分析や、Data Provenence Initiativeなどの関連レポートと合わせて読むことを推奨されています。
SOURCE: Hugging Face (2026-03-17)


