Holo3: Breaking the Computer Use Frontier カバー画像

Hugging Face が Holo3 をリリース ── OSWorldでSOTA獲得、アクティブ10B参数でGPT-5.4超えの衝撃

Byren_admin 2026年4月2日

HUGGING FACE

最終更新: 2026年04月02日 02:05　元記事 →

ついにPC操作ベンチマークのOSWorldで、GPT-5.4やOpus 4.6といった巨大モデルをぶっちぎる新モデルが登場した。しかも総パラメータ122Bのうち、実際に動くアクティブパラメータはわずか10Bという圧倒的な軽さだ。これはかなりやばい。

▸何が変わったのか

今回発表された「Holo3-122B-A10B」は、デスクトップPC操作のベンチマーク「OSWorld-Verified」でスコア78.85%を叩き出し、業界最高水準を更新した。GPT 5.4やOpus 4.6のような巨大モデルを少ないリソースで凌駕している点が本当に凄い。さらに「Agentic Learning Flywheel」というパイプラインを導入し、UIの認識から意思決定までを徹底的に強化。実務への適用性を渮るため、486の多段階タスクからなる「H Corporate Benchmarks」という独自評価スイートも用意された。

◈前モデル / 競合との比較

GPT 5.4やOpus 4.6といった巨大なプロプライエタリモデルに対し、アクティブパラメータ10Bという圧倒的な軽量さでOSWorld-Verifiedベンチマークのスコアを上回った。コストパフォーマンスの面で、既存の巨大モデルを完全に一歩リードしている。

◈技術背景と意義

Holo3の最大の強みは、人間がパソコンを操作するように「画面を見て、クリックして、タスクをこなす」という自律性の高さにある。その秘密が「Synthetic Environment Factory」という独自の学習環境だ。エンタープライズシステムの現実を仮想的に再現し、未知のUIでも臨機応変に対応できる総合力を徹底的に鍛え上げている。まさに、本番環境で即戦力となるために作られたAIエージェントと言える。

▸こんな人・用途に

ECサイトの在庫確認や注文処理など、ブラウザ上で完結する定型業務を自動化したいビジネス層。社内ビジネスソフトやコラボレーションツールをまたぐような、複雑な多段階ワークフローを丸投げしたい開発者。

▸Redditの反応

ローカル動作への関心が高い一方で、実際の使い方やモデルの正体についての疑問が散見される。そこまで熱狂的な盛り上がりはないけど、実用性を冷静に見極めようという空気感。

r/LocalLLaMA▲ 10

「コンピューター操作系のモデルって、ローカルで実際どうやって使うんだ？」

u/ForsookComparison

r/LocalLLaMA▲ 3

「これって要するにQwen 3.5のファインチューン版ってことで合ってる？」

u/Robos_Basilisk

r/LocalLLaMA▲ 1

「ローカルで動かせるの？」

u/TurbulentInternet728

◆入手方法・リンク

全モデルは公式のInference APIから利用可能。なお、小型モデルの「Holo3-35B-A3B」に限ってはHugging FaceでApache2ライセンスとして重みが公開されており、誰でも自由にダウンロードして使うことができる。

公式発表を読む

SOURCE: Hugging Face (2026-04-01)

← LLM Watch トップへ

OpenAI

OpenAI が ChatGPT for operations teams を公開 ── ワークフロー最適化で業務効率を爆上げ
Byren_admin 2026年4月14日

OpenAIが運用チーム向けにChatGPTの活用法を公開。ワークフローの合理化やプロセスの標準化など、業務効率を劇的に改善するヒントが詰まっている。

続きを読む OpenAI が ChatGPT for operations teams を公開 ── ワークフロー最適化で業務効率を爆上げ
Hugging Face

Hugging Face 記事で AWS の基盤モデル学習・推論のビルディングブロックが解説 ── スケーリング法則は「1つ」から「3つ」の時代へ
Byren_admin 2026年5月12日

AWS上の基盤モデル学習・推論インフラを解説。スケーリング法則は事前学習・ポストトレーニング・テスト時計算の3本柱へ。

続きを読む Hugging Face 記事で AWS の基盤モデル学習・推論のビルディングブロックが解説 ── スケーリング法則は「1つ」から「3つ」の時代へ
OpenAI

OpenAI x Choco が食品流通を自動化 ── AIエージェントが現場の生産性を変える
Byren_admin 2026年4月28日

ChocoがOpenAI APIで食品流通を自動化。注文処理の生産性向上とビジネス成長を実現したリアルなAI活用事例を紹介。

続きを読む OpenAI x Choco が食品流通を自動化 ── AIエージェントが現場の生産性を変える
OpenAI

OpenAI が GPT-5.5 をリリース ── サイバー防御に特化したモデルも登場
Byren_admin 2026年5月8日

OpenAIがGPT-5.5とサイバー特化モデルのGPT-5.5-Cyberを発表。認証防御者向けにTrusted Accessを拡大し、脆弱性調査やインフラ保護を支援する。

続きを読む OpenAI が GPT-5.5 をリリース ── サイバー防御に特化したモデルも登場
Hugging Face

NVIDIAが拡散モデルでテキスト生成の常識を覆す「Nemotron-Labs Diffusion」公開 ── 光速テキスト生成へ一歩近づく
Byren_admin 2026年5月23日

NVIDIAが拡散モデルベースの言語モデル「Nemotron-Labs Diffusion」を公開。並列生成と反復的洗練でARモデルの限界を突破する。

続きを読む NVIDIAが拡散モデルでテキスト生成の常識を覆す「Nemotron-Labs Diffusion」公開 ── 光速テキスト生成へ一歩近づく
Hugging Face

Hugging Face が Mixture of Experts (MoEs) in Transformers をガイド ── 効率化の常識を変える
Byren_admin 2026年2月27日2026年3月10日

Hugging FaceがMixture of Expertsの仕組みを解説。LLM効率化の鍵となる技術を紹介。

続きを読む Hugging Face が Mixture of Experts (MoEs) in Transformers をガイド ── 効率化の常識を変える

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

▸Redditの反応

◆入手方法・リンク

類似投稿

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル