Holo3: Breaking the Computer Use Frontier カバー画像

Hugging Face が Holo3 をリリース ── OSWorldでSOTA獲得、アクティブ10B参数でGPT-5.4超えの衝撃

HUGGING FACE

最終更新: 2026年04月02日 02:05 元記事 →

ついにPC操作ベンチマークのOSWorldで、GPT-5.4やOpus 4.6といった巨大モデルをぶっちぎる新モデルが登場した。しかも総パラメータ122Bのうち、実際に動くアクティブパラメータはわずか10Bという圧倒的な軽さだ。これはかなりやばい。

何が変わったのか

今回発表された「Holo3-122B-A10B」は、デスクトップPC操作のベンチマーク「OSWorld-Verified」でスコア78.85%を叩き出し、業界最高水準を更新した。GPT 5.4やOpus 4.6のような巨大モデルを少ないリソースで凌駕している点が本当に凄い。さらに「Agentic Learning Flywheel」というパイプラインを導入し、UIの認識から意思決定までを徹底的に強化。実務への適用性を渮るため、486の多段階タスクからなる「H Corporate Benchmarks」という独自評価スイートも用意された。

前モデル / 競合との比較

GPT 5.4やOpus 4.6といった巨大なプロプライエタリモデルに対し、アクティブパラメータ10Bという圧倒的な軽量さでOSWorld-Verifiedベンチマークのスコアを上回った。コストパフォーマンスの面で、既存の巨大モデルを完全に一歩リードしている。

技術背景と意義

Holo3の最大の強みは、人間がパソコンを操作するように「画面を見て、クリックして、タスクをこなす」という自律性の高さにある。その秘密が「Synthetic Environment Factory」という独自の学習環境だ。エンタープライズシステムの現実を仮想的に再現し、未知のUIでも臨機応変に対応できる総合力を徹底的に鍛え上げている。まさに、本番環境で即戦力となるために作られたAIエージェントと言える。

こんな人・用途に

ECサイトの在庫確認や注文処理など、ブラウザ上で完結する定型業務を自動化したいビジネス層。社内ビジネスソフトやコラボレーションツールをまたぐような、複雑な多段階ワークフローを丸投げしたい開発者。

Redditの反応

ローカル動作への関心が高い一方で、実際の使い方やモデルの正体についての疑問が散見される。そこまで熱狂的な盛り上がりはないけど、実用性を冷静に見極めようという空気感。

r/LocalLLaMA▲ 10

「コンピューター操作系のモデルって、ローカルで実際どうやって使うんだ?」

u/ForsookComparison
r/LocalLLaMA▲ 3

「これって要するにQwen 3.5のファインチューン版ってことで合ってる?」

u/Robos_Basilisk
r/LocalLLaMA▲ 1

「ローカルで動かせるの?」

u/TurbulentInternet728

入手方法・リンク

全モデルは公式のInference APIから利用可能。なお、小型モデルの「Holo3-35B-A3B」に限ってはHugging FaceでApache2ライセンスとして重みが公開されており、誰でも自由にダウンロードして使うことができる。

SOURCE: Hugging Face (2026-04-01)

← LLM Watch トップへ

類似投稿

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です