Hugging Face が Direct Preference Optimization Beyond Chatbots をリリース ── OCRの無限ループ地獄をDPOで撲滅
チャットAI向けのDPO技術をOCRの無限ループ対策に応用。テキスト劣化率を平均59.4%も削減した驚きのアプローチを紹介。
チャットAI向けのDPO技術をOCRの無限ループ対策に応用。テキスト劣化率を平均59.4%も削減した驚きのアプローチを紹介。
Hugging FaceがHolo3.1をリリース。モバイル環境のスコア大幅向上や、ローカル推論に最適化された量子化モデルの追加が目玉。
JetBrainsのMoEモデル「Mellum2」が12Bパラメータで登場。推論時は2.5Bのみ活性化し、2倍の高速性を実現。Apache 2.0ライセンス。
IBM Researchが提唱する企業AI導入の鍵「Agent Logic」とは。LLMのハルシネーションを抑え、業務フローを制御する手法。
NVIDIA Cosmos 3は物理AI向けオムニモデル。MoT採用で生成・推論・アクションを1モデルに統合。Hugging Faceで公開中。
Hugging FaceがPyTorchプロファイリング入門連載を開始。行列積からトレースの読み方やtorch.compileの変化を解説。
IBMとArtificial Analysisがエージェント型ITベンチマーク「ITBench-AA」を公開。最先端モデルでも正答率50%未満という結果に。
Hugging FaceのReachy Miniが完全ローカル化。クラウドやAPIキー不要で、データを外部に送らずにロボットと会話できる仕組みが登場した。
Hugging FaceがTRLでデルタウェイト同期を導入。1TBの重み同期ペイロードをわずか数MBに削減し、Async RLのコストを劇的に低下させる。
AIエージェント用語の混乱を解消。HarnessとScaffoldの違いをICLR 2026後の議論を基に整理したHugging Faceの用語集。