Hugging Face が Holo3 をリリース ── OSWorldでSOTA獲得、アクティブ10B参数でGPT-5.4超えの衝撃
ついにPC操作ベンチマークのOSWorldで、GPT-5.4やOpus 4.6といった巨大モデルをぶっちぎる新モデルが登場した。しかも総パラメータ122Bのうち、実際に動くアクティブパラメータはわずか10Bという圧倒的な軽さだ。これはかなりやばい。
▸何が変わったのか
今回発表された「Holo3-122B-A10B」は、デスクトップPC操作のベンチマーク「OSWorld-Verified」でスコア78.85%を叩き出し、業界最高水準を更新した。GPT 5.4やOpus 4.6のような巨大モデルを少ないリソースで凌駕している点が本当に凄い。さらに「Agentic Learning Flywheel」というパイプラインを導入し、UIの認識から意思決定までを徹底的に強化。実務への適用性を渮るため、486の多段階タスクからなる「H Corporate Benchmarks」という独自評価スイートも用意された。
◈前モデル / 競合との比較
GPT 5.4やOpus 4.6といった巨大なプロプライエタリモデルに対し、アクティブパラメータ10Bという圧倒的な軽量さでOSWorld-Verifiedベンチマークのスコアを上回った。コストパフォーマンスの面で、既存の巨大モデルを完全に一歩リードしている。
◈技術背景と意義
Holo3の最大の強みは、人間がパソコンを操作するように「画面を見て、クリックして、タスクをこなす」という自律性の高さにある。その秘密が「Synthetic Environment Factory」という独自の学習環境だ。エンタープライズシステムの現実を仮想的に再現し、未知のUIでも臨機応変に対応できる総合力を徹底的に鍛え上げている。まさに、本番環境で即戦力となるために作られたAIエージェントと言える。
▸こんな人・用途に
ECサイトの在庫確認や注文処理など、ブラウザ上で完結する定型業務を自動化したいビジネス層。社内ビジネスソフトやコラボレーションツールをまたぐような、複雑な多段階ワークフローを丸投げしたい開発者。
▸Redditの反応
ローカル動作への関心が高い一方で、実際の使い方やモデルの正体についての疑問が散見される。そこまで熱狂的な盛り上がりはないけど、実用性を冷静に見極めようという空気感。
「コンピューター操作系のモデルって、ローカルで実際どうやって使うんだ?」
「これって要するにQwen 3.5のファインチューン版ってことで合ってる?」
「ローカルで動かせるの?」
◆入手方法・リンク
全モデルは公式のInference APIから利用可能。なお、小型モデルの「Holo3-35B-A3B」に限ってはHugging FaceでApache2ライセンスとして重みが公開されており、誰でも自由にダウンロードして使うことができる。
SOURCE: Hugging Face (2026-04-01)
