SimArt カバー画像

ByteDance

ByteDance が SimArt をリリース ── 可動する3D構造をマルチモーダル入力から生成

ByLLM Watch編集部 2026年5月28日

BYTEDANCEOSS

最終更新: 2026年05月28日 22:03　元記事 →

ByteDanceがHugging Faceで「SimArt」の事前学習済み重みを公開した。テキストや画像などのマルチモーダルな入力から、関節の動く3Dモデルを生成できるらしい。ただの静的な3Dアセットじゃなくて、関節構造を持ったオブジェクトをAIが構築するというアプローチがかなり面白い。

▸何が変わったのか

リリースされたのは主に2つのモデルディレクトリ。`simartmllm/` にはマルチモーダル大規模言語モデル（MLLM）の重みが含まれていて、ベースは `Qwen3-VL-8B`（または類似のQwen-VLアーキテクチャ）からのファインチューニング。こちらは入力から `URDFファイル`（関節付き3D構造のデータ）を生成する役割を担う。もう一方の `simartvqvae/` は3Dパーツのジオメトリを離散潜在空間で扱うための Sparse VQ-VAE。`encoder.pt`、`vq.pt`、`decoder.pt` とファイルがしっかり分かれている。

◈技術背景と意義

URDFはロボットの関節やリンクなどの構造を記述するデータフォーマット。つまり、このモデルが扱うのは「ただの形」ではなく「どう動くか」まで含めた3Dデータだ。また、VQ-VAEという技術を使って、複雑な3D形状をコンパクトなデータ（離散潜在空間）に変換・復元している。これを挟むことで、LLMがより効率的に3Dの形状を理解・処理できるようになっている。

▸こんな人・用途に

・ロボット工学の研究者が、プロンプトから関節構造を持つプロトタイプのロボットモデルを素早く作りたいとき
・ゲーム開発やVTuberのアバター制作で、画像から動きのある3Dモデルのベース構造を生成したいとき

◆入手方法・リンク

現在、モデルの重みはHugging Faceで公開されている。GitHubのリポジトリリンクは現時点では確認できない。

公式発表を読む

SOURCE: ByteDance (2026-05-19)

← LLM Watch トップへ

Tencent

Tencent が Universal_Audio_Tokenizer をリリース ── セマンティックと音響の溝を埋めるシングルコードブック設計
ByLLM Watch編集部 2026年6月2日

Tencentが音声の「意味」と「音質」を単一トークナイザーで両立するUniversal Audio TokenizerをOSS公開。

続きを読む Tencent が Universal_Audio_Tokenizer をリリース ── セマンティックと音響の溝を埋めるシングルコードブック設計
Tencent

Tencent が Penguin-VL-8B をリリース ── VLMの効率限界に挑む新アーキテクチャ
ByLLM Watch編集部 2026年3月7日2026年3月10日

TencentがPenguin-VL-8BをOSS公開。LLMベースの視覚エンコーダと動画理解機能を搭載。

続きを読む Tencent が Penguin-VL-8B をリリース ── VLMの効率限界に挑む新アーキテクチャ
Alibaba (Qwen)

Alibaba (Qwen) が Qwen-Scope (SAE) をリリース ── Qwen3-30B-A3Bの内部を131,072次元で解読
ByLLM Watch編集部 2026年4月30日

AlibabaがQwen3-30B-A3B向けSAE「Qwen-Scope」を公開。131,072次元のスパース特徴でLLM内部を解読する試み。

続きを読む Alibaba (Qwen) が Qwen-Scope (SAE) をリリース ── Qwen3-30B-A3Bの内部を131,072次元で解読
Tencent

Tencent が Hy3 をリリース
ByLLM Watch編集部 2026年7月6日

TencentのHy3リリース情報

続きを読む Tencent が Hy3 をリリース
Alibaba (Qwen)

Alibaba (Qwen) が Qwen3.5-0.8B-Base をリリース ── 0.8Bで最大100万トークン対応の超軽量モデル
ByLLM Watch編集部 2026年3月2日2026年3月10日

Alibabaが0.8Bパラメータの「Qwen3.5-0.8B-Base」を公開。100万トークン超対応で衝撃。

続きを読む Alibaba (Qwen) が Qwen3.5-0.8B-Base をリリース ── 0.8Bで最大100万トークン対応の超軽量モデル
Tencent

Tencent が Hy-Embodied-VLM-1.0 をリリース
ByLLM Watch編集部 2026年7月15日

TencentのHy-Embodied-VLM-1.0リリース情報

続きを読む Tencent が Hy-Embodied-VLM-1.0 をリリース

コメントを残すコメントをキャンセル