Hy3-preview-Base カバー画像

Tencent

Tencent が Hy3-preview-Base をリリース ── 295Bの超巨大MoE、アクティブ21Bで競合を凌駕

Byren_admin 2026年4月23日

TENCENTOSS

最終更新: 2026年04月23日 19:07　元記事 →

Tencentが新型モデルをぶっ込んできた。名前は「Hy3-preview-Base」。総パラメータ295BというとんでもないスケールのMoE（専門家混合）モデルだ。推論時に動くパラメータは21Bに抑えつつ、既存の大型モデルを食うくらいのベンチマークスコアを叩き出している。これ、かなりエグい。

▸何が変わったのか

最大の特徴は、総パラメータ295Bに対してアクティブパラメータが21B、MTPレイヤーパラメータが3.8Bという構成。192個のエキスパートから賢くtop-8を選択して動く仕組みで、最大256Kという長いコンテキスト長をカバーしている。複雑な推論（STEM）やコーディング、エージェント能力が前述の通り大幅に向上しているという。

◈前モデル / 競合との比較

アクティブパラメータが21BとDeepSeek-V3 BASE（37B）などより少ないにもかかわらず、MMLU-Proで「65.76」を記録し、DeepSeek-V3 BASEの「63.98」やGLM-4.5 BASEの「63.67」を上回るスコアをマーク。少ない計算リソースから圧倒的な効率で賢さを引き出しているのが際立つ。

◈技術背景と意義

MoE（Mixture-of-Experts）は、タスクに合わせてAIの頭脳内から適切な「専門家」だけをピックアップして動かす仕組みだ。全部のパラメータを一度に動かさないため、超巨大な頭脳を持ちながら計算コストをグッと抑えられる。今のハイエンドAI開発における鉄板のアプローチと言えるね。

▸こんな人・用途に

複雑な数学オリンピックレベルの問題などの理系タスク（STEM＆Reasoning）。長文から必要な情報を拾い上げる精度が求められるRAGや検索エージェント。SWE-benchなどで評価されるような、高度なコーディングとツール利用を伴う自律型エージェント。

▸Redditの反応

AI 3Dツールにおけるノードベースのワークフローの有用性について語るスレッドだけど、提供されたコメントを見る限り、特定の拡張機能のインストールでつまずいている人がいるみたい。実用的なトラブル報告といった雰囲気だ。

r/LocalLLaMA▲ 1

「エラー画面のスクショを貼り付けて、「trellis2拡張機能がインストールできないんだけど」と助けを求めている。新しいツールを試そうとして早速壁にぶつかってしまったようだ。」

u/Pitiful_Gene_3648

◆入手方法・リンク

Hugging Faceにてオープンソースとして公開されている。誰でもモデルをダウンロードして試すことが可能だ。

公式発表を読む

SOURCE: Tencent (2026-04-13)

← LLM Watch トップへ

DeepSeek

DeepSeek が DeepSeek-V4 をリリース ── 100万トークン対応、KVキャッシュ劇減の超効率アーキテクチャ
Byren_admin 2026年4月24日2026年4月24日

DeepSeek-V4がリリース。100万トークン対応でKVキャッシュをV3.2の10%に削減、オープンソース最高峰を宣言

続きを読む DeepSeek が DeepSeek-V4 をリリース ── 100万トークン対応、KVキャッシュ劇減の超効率アーキテクチャ
Tencent

Tencent が VersaViT をリリース ── マルチモーダル向けの万能視覚エンコーダー
Byren_admin 2026年3月29日2026年3月29日

Tencentが公開したVersaViTは、LLMとの言語推論からピクセルレベルの画像理解までこなす万能視覚エンコーダー。

続きを読む Tencent が VersaViT をリリース ── マルチモーダル向けの万能視覚エンコーダー
Tencent

Tencent が Covo-Audio-Chat をリリース ── 音声から音声へ、テキストを介さないエンドツーエンド対話
Byren_admin 2026年3月16日

Tencentが音声を直接処理する7Bパラメータのエンドツーエンド音声言語モデルCovo-Audio-ChatをOSSで公開。

続きを読む Tencent が Covo-Audio-Chat をリリース ── 音声から音声へ、テキストを介さないエンドツーエンド対話
Tencent

Tencent が HY-World-2.0 をリリース ── 動画じゃない、遊べるリアル3Dアセットを直接生成
Byren_admin 2026年4月16日

Tencentがオープンソースで公開したHY-World 2.0は、テキストや画像から編集可能なリアル3D空間を直接生成する革新的なモデルです。

続きを読む Tencent が HY-World-2.0 をリリース ── 動画じゃない、遊べるリアル3Dアセットを直接生成
Tencent

Tencent が Unified_Audio_Schema をリリース ── 聴いて話す、音声の理解と生成を統合したマルチモーダルモデル
Byren_admin 2026年4月17日

Tencentがテキストと音声の相互入出力に対応したUnified Audio Schemaを公開。感情や非言語情報の理解・生成が可能に。

続きを読む Tencent が Unified_Audio_Schema をリリース ── 聴いて話す、音声の理解と生成を統合したマルチモーダルモデル
Mistral

Mistral が Mistral-Small-4-119B-2603-eagle をリリース ── 推論・コード・ビジネスを1つに統合したハイブリッドモンスター
Byren_admin 2026年3月17日

Mistral Small 4登場。119Bパラメータのハイブリッドモデルが推論・コードを統合、Apache 2.0でOSS化。

続きを読む Mistral が Mistral-Small-4-119B-2603-eagle をリリース ── 推論・コード・ビジネスを1つに統合したハイブリッドモンスター

コメントを残すコメントをキャンセル