Zhipu AI が SCAIL-2 をリリース ── 骨格推定なしでエンドツーエンドのキャラクターアニメーションを実現
Zhipu AIがオープンソースのキャラクター動画モデル「SCAIL-2」を公開。骨格抽出なしでエンドツーエンド駆動し、動物の動きにも対応。
Zhipu AIがオープンソースのキャラクター動画モデル「SCAIL-2」を公開。骨格抽出なしでエンドツーエンド駆動し、動物の動きにも対応。
Tencentが音声の「意味」と「音質」を単一トークナイザーで両立するUniversal Audio TokenizerをOSS公開。
ByteDanceがSimArtの重みを公開。Qwen3-VL-8Bベースのモデルで、マルチモーダル入力から関節付き3D構造を生成。
Alibabaが画像生成(T2I)の品質を自動評価するQwen-Image-Benchを公開。Qwen3.6-27BベースのQ-Judgerが思考推論を経て詳細に採点する。
Tencentが33言語対応の翻訳モデルHy-MT2を公開。1.8Bモデルは1.25ビット量子化で440MBに圧縮可能。
Tencentが多言語翻訳特化モデルHy-MT2シリーズを公開。33言語対応、1.8Bは440MBで動く。
ByteDanceのCola-DLMは拡散モデルを言語生成に応用した異端のLLM。Text VAE+DiT構成でHuggingFace公開。
AlibabaがLLMの内部挙動を解読するための解釈可能性モジュール「Qwen-Scope」を公開。TopK SAEを用いてモデルの思考を可視化。
AlibabaがQwen3-30B-A3B向けSAE「Qwen-Scope」を公開。131,072次元のスパース特徴でLLM内部を解読する試み。
アリババがQwen3.5用のSAE解釈モジュール「Qwen-Scope」をリリース。全40層対応、TopK=100のSparse Autoencoderでモデル内部を解析可能。