HY-Embodied-0.5 カバー画像

Tencent

Tencent が HY-Embodied-0.5 をリリース ── 思考モードを搭載した画像言語モデル

Byren_admin 2026年4月9日

TENCENTOSS

最終更新: 2026年04月09日 05:03　元記事 →

TencentがHugging Faceで新しいオープンソースモデルを公開。説明文の大部分はまだプレースホルダーだが、公開された推論コードからかなり野心的な仕組みが見えてくる。画像とテキストを処理するアーキテクチャに、なんと「思考モード」が組み込まれている。

▸何が変わったのか

リリースされた「HY-Embodied-0.5」は、画像と言語を統合的に処理するモデル。推論スクリプト内で `AutoModelForImageTextToText` が使われており、画像入力に対応していることがわかる。注目は `enable_thinking` というパラメータ。このフラグを切り替えることで、モデルの思考プロセスをオン・オフできる仕組みだ。また、動作環境として PyTorch 2.8.0、CUDA 12.6、Python 3.12+ を推奨している。モデルのサイズは8GBで、実行には16GB以上のVRAMが必要。

◈技術背景と意義

モデル名に入っている「Embodied（身体性）」という言葉から、ロボット工学や実世界のタスク実行を狙ったAIである可能性が高い。カメラの画像を見て現状を把握し、深く思考（Thinking）した上で次のアクションを決めるような使い方を想定しているのだろう。16GBのVRAMで動くよう設計されているので、ハイエンドのコンシューマー向けGPUでもローカル推論が可能だ。

▸こんな人・用途に

– ロボットやドローンの視覚認識と行動計画
– 画像を伴う複雑な推論タスク（思考モードを活用）
– 次世代マルチモーダルアーキテクチャの研究・検証

◆入手方法・リンク

Hugging Faceの「tencent/HY-Embodied-0.5」から誰でもダウンロード可能。推論コードを実行すると自動的にモデルウェイト（8GB）がダウンロードされる仕組みになっている。

公式発表を読む

SOURCE: Tencent (2026-04-02)

← LLM Watch トップへ

Alibaba (Qwen)

Alibaba (Qwen) が Qwen3.5-2B-Base をリリース
Byren_admin 2026年3月2日2026年3月10日

Alibaba (Qwen)のQwen3.5-2B-Baseリリース情報

続きを読む Alibaba (Qwen) が Qwen3.5-2B-Base をリリース
Alibaba (Qwen)

Alibaba (Qwen) が Qwen3.5-122B-A10B をリリース ── 122Bの知性を10Bの軽さで実現する野心的なアーキテクチャ
Byren_admin 2026年2月26日2026年3月10日

AlibabaがQwen3.5-122B-A10BをOSS公開。122Bの知性を10Bの軽さで実現する新構造が話題。

続きを読む Alibaba (Qwen) が Qwen3.5-122B-A10B をリリース ── 122Bの知性を10Bの軽さで実現する野心的なアーキテクチャ
Tencent

Tencent が VersaViT をリリース ── マルチモーダル向けの万能視覚エンコーダー
Byren_admin 2026年3月29日2026年3月29日

Tencentが公開したVersaViTは、LLMとの言語推論からピクセルレベルの画像理解までこなす万能視覚エンコーダー。

続きを読む Tencent が VersaViT をリリース ── マルチモーダル向けの万能視覚エンコーダー
Tencent

Tencent が Covo-Audio-Chat をリリース ── 音声から音声へ、テキストを介さないエンドツーエンド対話
Byren_admin 2026年3月16日

Tencentが音声を直接処理する7Bパラメータのエンドツーエンド音声言語モデルCovo-Audio-ChatをOSSで公開。

続きを読む Tencent が Covo-Audio-Chat をリリース ── 音声から音声へ、テキストを介さないエンドツーエンド対話
Alibaba (Qwen)

Alibaba (Qwen) が Qwen3.5-0.8B-Base をリリース ── 0.8Bで最大100万トークン対応の超軽量モデル
Byren_admin 2026年3月2日2026年3月10日

Alibabaが0.8Bパラメータの「Qwen3.5-0.8B-Base」を公開。100万トークン超対応で衝撃。

続きを読む Alibaba (Qwen) が Qwen3.5-0.8B-Base をリリース ── 0.8Bで最大100万トークン対応の超軽量モデル
Zhipu AI

Zhipu AI が GLM-5.1 をリリース ── 長く動かすほど賢くなるエージェント特化型
Byren_admin 2026年4月8日

Zhipu AIのGLM-5.1がHugging Faceに登場。長時間の自律作業で真価を発揮するエージェント特化型で、SWE-Bench Pro等でSOTAを達成。

続きを読む Zhipu AI が GLM-5.1 をリリース ── 長く動かすほど賢くなるエージェント特化型

コメントを残すコメントをキャンセル