Hugging Face が Build real agentic apps using CUGA: two dozen working examples on a lightweight harness をリリース ── エージェント開発の「配管作業」を消し去るIBM製ハーネス

HUGGING FACE

最終更新: 2026年06月23日 22:02　元記事 →

エージェントアプリを作ろうとすると、大体1週間くらい「配管作業」で潰れる。モデルクライアント繋いで、ツールアダプタ書いて、ステート管理して……やっと本体に取りかける頃には燃え尽きる。それを「ツールのリストとプロンプトだけ書けばいい」ところまで削り込んだのが、IBM Researchが公開したCUGAだ。24個の動くサンプルアプリまで付いてきていて、これはかなり嬉しい。

▸何が変わったのか

CUGA（Configurable Generalist Agent）は、エージェント開発におけるオーケストレーション周りを全部引き受けるハーネス。プランニング、実行ループ、ツール呼び出し、ステート管理を内包している。開発者が書くのは「どのツールを使えるか」と「何をさせるか」だけ。24個のサンプルアプリ（cuga-apps）はどれもFastAPI1ファイルで完結し、映画レコメンダーからIBM Cloudのアーキテクチャアドバイザーまで幅広い。長期タスクで途中結果を失いがちな問題には、リフレクションステップを挟んで悪手を検知し再プランニングする仕組みがある。AppWorldやWebArenaといったエージェントベンチマークでトップクラスの成績。コスト/レイテンシのトレードオフはFast・Balanced・Accurateの3モードをコンフィグで切り替え。サンドボックスはlocal、Docker/Podman、E2B cloudから選べる。

◈前モデル / 競合との比較

多くのハーネスはフロンティアモデル（GPT-4クラス）が下にある前提で設計され、計画が外れた時にモデルの力でリカバリーしようとする。CUGAはリフレクションによる自己修正を仕組み化している点が異なる。またAppWorld・WebArenaでトップ成績を出しているのは、手動チューニングではなくアーキテクチャレベルの強さの表れだとIBMは主張している。

◈技術背景と意義

「フレームワーク」ではなく「ハーネス」だとIBMは強調している。違いは、フレームワークが組み立て方を指定する道具箱なのに対し、ハーネスは既に動く骨組みそのものを提供する点。CUGAは行動の前にプランニングを行い、ツール呼び出しとコード生成（CodeAct）を混ぜて実行する。20ステップ超える長期タスクで途中結果を見失う──これが大半のエージェントが死ぬ原因だが、CUGAは内部ステートを保持した上でリフレクションを回して自己修正する。要するに「配管も計画も反射神経も全部込み」なので、開発者はドメイン知識だけ注ぎ込めばいい。

▸こんな人・用途に

FastAPIを書いたことがある人なら全行読める設計なので、エージェント初心者には学習素材として最適。24個のサンプルをコピペして改造すれば、自分のユースケースにあてはめやすい。プロダクション環境では governance対応の同一コードを再利用できるので、企業でPoCから本番まで一気通貫させたいチームにもマッチする。

◆入手方法・リンク

pip install cuga でインストール可能。サンプルアプリはライブギャラリーとしてクリックで公開されており、各アプリは1ファイルのFastAPIで読める構成。記事はHugging Face Blog上で2026年6月23日に公開。

公式発表を読む

SOURCE: Hugging Face (2026-06-23)

← LLM Watch トップへ

Hugging Face が Build real agentic apps using CUGA: two dozen working examples on a lightweight harness をリリース ── エージェント開発の「配管作業」を消し去るIBM製ハーネス

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

◆入手方法・リンク

OpenAI が ChatGPT for operations teams を公開 ── ワークフロー最適化で業務効率を爆上げ

Google DeepMind が Gemini-powered エージェント「AlphaEvolve」をリリース ── ゲノム解析のエラーを30%削減

OpenAI が Understanding AI and learning outcomes を公開 ── AIの教育効果を測る「Learning Outcomes Measurement Suite」登場

Hugging Face が AI Agent 用語集を公開 ── Harness と Scaffold の違い、ちゃんと説明してみた

OpenAI が How Ramp engineers accelerate code review with Codex をリリース ── GPT-5.5を活用しレビューを数分に短縮

Hugging Face が IBM and UC Berkeley Diagnose Why Enterprise Agents Fail Using IT-Bench and MAST を紹介 ── エージェントが仕事でドツボにハマる理由を解明

コメントを残すコメントをキャンセル

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

◆入手方法・リンク

類似投稿

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル