NVIDIAが拡散モデルでテキスト生成の常識を覆す「Nemotron-Labs Diffusion」公開 ── 光速テキスト生成へ一歩近づく
NVIDIAが拡散モデルベースの言語モデル「Nemotron-Labs Diffusion」を公開。並列生成と反復的洗練でARモデルの限界を突破する。
NVIDIAが拡散モデルベースの言語モデル「Nemotron-Labs Diffusion」を公開。並列生成と反復的洗練でARモデルの限界を突破する。
30億パラメータの特化型モデルが商用フロンティアAPIを撃破。コスト約50分の1で品質も上回る衝撃の結果とは。
OlmoEarth v1.1は、トークン系列長の最適化により衛星画像解析の計算コストを最大3分の1に削減しつつ、高精度な性能を維持した効率的なモデル。
Hugging Face が Ettin Reranker Family をリリース。ModernBERT ベースの 6 サイズ展開、各クラス SOTA 狙い。
Hugging FaceがModernBERTベースのリランカー「Ettin」6モデルを公開。17M〜1Bの豊富なサイズ展開が魅力。
NVIDIAのCosmos Predict 2.5をLoRA/DoRAでファインチューニングし、ロボット用合成データを生成する手法がHugging Faceで公開。80GB GPU1枚で学習可能。
PaddleOCR 3.5がTransformers推論バックエンドに対応。PP-OCRv5やPaddleOCR-VL 1.5をHugging Faceエコシステムで簡単利用可能に。
Hugging FaceがAIエージェントの汎用性を品質とコストの両面から評価する新ベンチマークを公開。
Hugging Faceがエージェントシステム全体を評価するOpen Agent Leaderboardを公開。品質もコストも見える化する新しいベンチマーク。
IBM Granite Embedding Multilingual R2がリリース。97Mモデルで最高峰の多言語検索品質と32Kコンテキストを実現。