Hugging Face が DeepInfra on Hugging Face Inference Providers 🔥 をリリース ── 最安値クラスのサーバーレス推論がHub直結で使えるように
Hugging FaceがDeepInfraをInference Providerとして追加。100超モデルが最安値クラスで使えるサーバーレス推論環境
Hugging FaceがDeepInfraをInference Providerとして追加。100超モデルが最安値クラスで使えるサーバーレス推論環境
Hugging Faceが警告、AI評価コストが許容範囲を超える。エージェント評価で数万ドル、モデル開発のコストを超す可能性も。
IBMのGranite 4.1は15Tトークンで学習した3B〜30BのLLM。8Bモデルが前世代の32Bモデルを凌駕。最大512Kトークンの長文コンテキストに対応。
NVIDIAの新モデルNemotron 3 Nano Omniがテキスト・画像・音声・動画を統合処理。VoiceBench 89.4、OSWorld 47.4を記録。
NVIDIAとSiemens Healthineersが開発した「NV-Raw2Insights-US」が、超音波の生データから患者ごとの音速マップを生成してリアルタイム画像補正を実現。
OpenAIの1.5BパラメータPII検出モデル「Privacy Filter」を使ったスケーラブルなWebアプリ構築チュートリアルが公開。
OpenAIのPrivacy Filterは128k文脈を一発処理するPII検出モデル。Hugging Faceが3つのデモアプリを公開。
DeepSeek-V4は1Mトークンのコンテキストをエージェント用途で実用化。推論FLOPsやKVキャッシュを劇的に削減するアーキテクチャが最大の特徴。
Transformers.jsとGemma 4 E2Bを用いたChrome拡張機能開発ガイドが公開。MV3環境で最適なアーキテクチャ設計に注目。
Hugging Faceが「Mythos」を例に挙げ、自律型AIがもたらすサイバーセキュリティの未来と、オープン性が防衛における構造的利点になる理由を熱く解説。