HY-OmniWeaving カバー画像

Tencent

Tencent が HY-OmniWeaving をリリース ── テキスト・画像・動画を自由に入力できる統合動画生成モデル

Byren_admin 2026年4月3日

TENCENTOSS

最終更新: 2026年04月03日 14:03　元記事 →

TencentのHunyuanチームが、かなり野心的な動画生成モデルを公開した。テキスト、複数画像、動画を好きに混ぜて入力できるうえに、ユーザーの意図を推論していい感じに動画を作ってくれるという。オープンソースでこのレベルのモデルが出てくるとは本当に熱い。

▸何が変わったのか

OmniWeavingは、HunyuanVideo-1.5をバックボーンに採用した統合動画生成モデル。MLLM + MMDiT + VAEの統合フレームワークで、インターリーブされた（混在する）テキスト・画像・動画入力を処理可能。特にMLLMの「Thinking Mode」を活性化する改良が加えられており、入力の曖昧さを解消してユーザーの意図を推論する仕組みを実装している。評価用ベンチマークとして「IntelligentVBench」も同時リリース。

◈前モデル / 競合との比較

Seedance-2.0などのプロプライエタリシステムが高性能だった一方で、オープンソースモデルは大きく遅れをとっていた。OmniWeavingは、オープンソースの統合動画生成モデルの中でSoTA（最高性能）を達成したと主張している。

◈技術背景と意義

従来の動画生成は「テキストから動画」が基本だったけど、OmniWeavingはもっと自由。例えば「この画像の人物と、この動画の背景を組み合わせて、こんなテキストのシーンを作って」みたいな複雑な指示に対応できる。MLLMが指示を理解し、VAEが画像や動画を圧縮し、MMDiTがそれらを統合して高品質な動画を生成する仕組み。Seedance-2.0のようなプロプライエタリモデルに匹敵する性能を、オープンソースで実現したのが大きい。

▸こんな人・用途に

複数の参考画像から一貫した世界観の動画を作りたいクリエイター。商品画像とテキスト説明からプロモーション動画を生成したいマーケター。既存動画の雰囲気を別素材と組み合わせて再構成したい映像制作担当者。

◆入手方法・リンク

Hugging Faceでコードとモデルウェイトが公開されている。GitHubリンクは現時点では確認できず。論文はArxivで3月26日に公開済み。

公式発表を読む

SOURCE: Tencent (2026-03-31)

← LLM Watch トップへ

Tencent

Tencent が HY-World-2.0 をリリース ── 動画じゃない、遊べるリアル3Dアセットを直接生成
Byren_admin 2026年4月16日

Tencentがオープンソースで公開したHY-World 2.0は、テキストや画像から編集可能なリアル3D空間を直接生成する革新的なモデルです。

続きを読む Tencent が HY-World-2.0 をリリース ── 動画じゃない、遊べるリアル3Dアセットを直接生成
Alibaba (Qwen)

Alibaba (Qwen) が Qwen3.6-35B-A3B をリリース ── 総パラメ35Bでアクティブ3B、驚異的な軽さとコーディング性能
Byren_admin 2026年4月16日2026年4月17日

AlibabaがQwen3.6-35B-A3Bをリリース。総パラメ35B/アクティブ3Bの超軽量設計で最大101万トークンを処理し、コーディングエージェント性能が大幅向上。

続きを読む Alibaba (Qwen) が Qwen3.6-35B-A3B をリリース ── 総パラメ35Bでアクティブ3B、驚異的な軽さとコーディング性能
Alibaba (Qwen)

Alibaba (Qwen) が Qwen3.5-0.8B-Base をリリース ── 0.8Bで最大100万トークン対応の超軽量モデル
Byren_admin 2026年3月2日2026年3月10日

Alibabaが0.8Bパラメータの「Qwen3.5-0.8B-Base」を公開。100万トークン超対応で衝撃。

続きを読む Alibaba (Qwen) が Qwen3.5-0.8B-Base をリリース ── 0.8Bで最大100万トークン対応の超軽量モデル
Tencent

Tencent が Sequential-Hidden-Decoding-8B-n8-Instruct をリリース ── 同じTransformerでシーケンス長を8倍に伸ばす異色のアプローチ
Byren_admin 2026年3月31日2026年3月31日

TencentがSequential Hidden Decoding手法でシーケンス長を8倍に拡張した8Bモデルを公開。Qwen3ベースでコンテキスト131Kトークン対応。

続きを読む Tencent が Sequential-Hidden-Decoding-8B-n8-Instruct をリリース ── 同じTransformerでシーケンス長を8倍に伸ばす異色のアプローチ
Zhipu AI

Zhipu AI が GLM-5.1 をリリース ── 長く動かすほど賢くなるエージェント特化型
Byren_admin 2026年4月8日

Zhipu AIのGLM-5.1がHugging Faceに登場。長時間の自律作業で真価を発揮するエージェント特化型で、SWE-Bench Pro等でSOTAを達成。

続きを読む Zhipu AI が GLM-5.1 をリリース ── 長く動かすほど賢くなるエージェント特化型
Tencent

Tencent が Penguin-VL-8B をリリース ── VLMの効率限界に挑む新アーキテクチャ
Byren_admin 2026年3月7日2026年3月10日

TencentがPenguin-VL-8BをOSS公開。LLMベースの視覚エンコーダと動画理解機能を搭載。

続きを読む Tencent が Penguin-VL-8B をリリース ── VLMの効率限界に挑む新アーキテクチャ

コメントを残すコメントをキャンセル