Hugging Face が IBM and UC Berkeley Diagnose Why Enterprise Agents Fail Using IT-Bench and MAST を紹介 ── エージェントが仕事でドツボにハマる理由を解明
IBMとUCバークレーが企業向けAIエージェントの失敗要因を分析。IT-BenchとMASTを使った新研究を紹介。
IBMとUCバークレーが企業向けAIエージェントの失敗要因を分析。IT-BenchとMASTを使った新研究を紹介。
OpenAIとFigmaが統合し、コードとデザインのシームレスな連携を実現。
Hugging FaceがMixture of Expertsの仕組みを解説。LLM効率化の鍵となる技術を紹介。
Hugging Face、JetsonでVLM稼働させる手法を公開。エッジAIの可能性が広がる。
Hugging Faceがllama.cppとGGMLを正式に受け入れ、ローカルAIの長期的な発展を約束。コミュニティの熱望が形に。
Hugging FaceとUnslothが提携し、無料でAIモデルを学習できる環境が整備されました。
企業のAIエージェントが失敗する理由を診断。IBMとUCバークレーがMASTとIT-Benchを公開
OpenAIとPNNLが政府許認可の効率化を狙う新ベンチマークを導入、15%の時間短縮へ。
Google DeepMindの新モデル「Nano Banana 2」が登場。Pro級の高品質と超高速処理を両立。
OpenAI、SWE-bench Verified評価の停止を表明。汚染とテスト不備によりスコアの信頼性が低下したため、SWE-bench Proへの移行を推奨。