DeepInfra on Hugging Face Inference Providers 🔥 カバー画像

Hugging Face が DeepInfra on Hugging Face Inference Providers 🔥 をリリース ── 最安値クラスのサーバーレス推論がHub直結で使えるように

HUGGING FACE

最終更新: 2026年04月30日 08:02 元記事 →

これは地味に嬉しいアップデート。Hugging FaceのHub上で直接サーバーレス推論を叩けるプロバイダーとして、DeepInfraが正式に加わった。100種類以上のモデルが業界最安値レベルのトークン単価で使えるって、開発者にとってかなり悪くない選択肢になるはず。

何が変わったのか

DeepInfraがHugging Face HubのInference Providerとしてサポート開始。カタログは100モデル以上で、LLMからtext-to-image、text-to-video、embeddingsまで幅広くカバー。初期統合では会話・テキスト生成タスクに対応し、DeepSeek V4、Kimi-K2.6、GLM-5.1といった人気オープンウェイトLLMがすぐ使える。追加タスク(text-to-image等)は今後順次ロールアウト。APIキーを自分で設定する「Custom key」モードと、HF経由で課金される「Routed by HF」モードの2つから選べる。

前モデル / 競合との比較

他のInference Providerと比べた際の明確な強みは、業界最安値クラスのトークン単価。ただし初期対応タスクが会話・テキスト生成のみで、text-to-image等は今後の対応予定。

技術背景と意義

サーバーレス推論とは、自分でGPUサーバーを立てなくてもAPI経由でモデルを使える仕組み。Hugging Faceは複数プロバイダーを統合していて、モデルページからワンクリックで切り替え可能。DeepInfraは特にコストパフォーマンスに優れた選択肢。Python SDK(huggingface_hub >= 1.11.2)とJavaScript SDK(@huggingface/inference)のどちらでもシームレスに呼び出せる。

こんな人・用途に

とにかく安くLLM APIを叩きたい個人開発者・スタートアップ。エージェントハーネス(LangChain等)と組み合わせて低コストなAIアプリを構築したい人。複数モデルを気軽に試して比較したい研究者。

入手方法・リンク

Hugging Face Hubのモデルページから直接利用可能。Python SDKは huggingface_hub >= 1.11.2、JSは @huggingface/inference から。対応モデル一覧と詳細は https://huggingface.co/DeepInfra を参照。

SOURCE: Hugging Face (2026-04-29)

← LLM Watch トップへ

類似投稿

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です