Hugging Face が DeepInfra on Hugging Face Inference Providers 🔥 をリリース ── 最安値クラスのサーバーレス推論がHub直結で使えるように
これは地味に嬉しいアップデート。Hugging FaceのHub上で直接サーバーレス推論を叩けるプロバイダーとして、DeepInfraが正式に加わった。100種類以上のモデルが業界最安値レベルのトークン単価で使えるって、開発者にとってかなり悪くない選択肢になるはず。
▸何が変わったのか
DeepInfraがHugging Face HubのInference Providerとしてサポート開始。カタログは100モデル以上で、LLMからtext-to-image、text-to-video、embeddingsまで幅広くカバー。初期統合では会話・テキスト生成タスクに対応し、DeepSeek V4、Kimi-K2.6、GLM-5.1といった人気オープンウェイトLLMがすぐ使える。追加タスク(text-to-image等)は今後順次ロールアウト。APIキーを自分で設定する「Custom key」モードと、HF経由で課金される「Routed by HF」モードの2つから選べる。
◈前モデル / 競合との比較
他のInference Providerと比べた際の明確な強みは、業界最安値クラスのトークン単価。ただし初期対応タスクが会話・テキスト生成のみで、text-to-image等は今後の対応予定。
◈技術背景と意義
サーバーレス推論とは、自分でGPUサーバーを立てなくてもAPI経由でモデルを使える仕組み。Hugging Faceは複数プロバイダーを統合していて、モデルページからワンクリックで切り替え可能。DeepInfraは特にコストパフォーマンスに優れた選択肢。Python SDK(huggingface_hub >= 1.11.2)とJavaScript SDK(@huggingface/inference)のどちらでもシームレスに呼び出せる。
▸こんな人・用途に
とにかく安くLLM APIを叩きたい個人開発者・スタートアップ。エージェントハーネス(LangChain等)と組み合わせて低コストなAIアプリを構築したい人。複数モデルを気軽に試して比較したい研究者。
◆入手方法・リンク
Hugging Face Hubのモデルページから直接利用可能。Python SDKは huggingface_hub >= 1.11.2、JSは @huggingface/inference から。対応モデル一覧と詳細は https://huggingface.co/DeepInfra を参照。
SOURCE: Hugging Face (2026-04-29)

