Hy-MT2-1.8B カバー画像

Tencent

Tencent が Hy-MT2-1.8B をリリース ── 1.25ビット量子化で440MB、デバイス上で動く33言語翻訳モデル

ByLLM Watch編集部 2026年5月21日

TENCENTOSS

最終更新: 2026年05月21日 16:09　元記事 →

Tencentが多言語翻訳モデルの新シリーズ「Hy-MT2」をHugging Faceなどで公開した。今回リリースされたのは1.8B、7B、30B-A3B (MoE)の3サイズ。なかでも軽量な1.8Bモデルの破壊力がすごい。極限量子化をかけると、なんと容量わずか440MBまで圧縮できる。スマホのローカルでもサクサク動く翻訳特化モデルの登場だ。

▸何が変わったのか

展開されているのは1.8B、7B、30B-A3B (MoE)という3つのサイズ。33言語の相互翻訳をサポートし、複雑な実環境を想定した「高速思考」設計になっている。目を見張るのは「AngelSlim」を用いた1.25ビットの極限量子化テクニック。1.8Bモデルのストレージ要件を440MBまで削減しつつ、推論速度を1.5倍も引き上げている。また、翻訳時の指示追従能力を評価するベンチマーク「IFMTBench」も同時にオープンソース化された。

◈前モデル / 競合との比較

公式のアナウンスによれば、7Bおよび30B-A3BモデルはDeepSeek-V4-ProやKimi K2.6といった強豪オープンソースモデルを凌駕。1.8BモデルでもMicrosoftやDoubaoなどの主流な商用APIを総合的に上回る性能を示している。

◈技術背景と意義

巨大なLLMに翻訳させるのも良いけれど、やはり特化型モデルの軽量・高速さは魅力的。Hy-MT2の7B以上のモデルはfast-thinkingモードにおいてDeepSeek-V4-ProやKimi K2.6を上回る性能を叩き出す。さらに軽量な1.8Bモデルに至っては、MicrosoftやDoubaoといった主要商用APIを総合的に凌駕するという。限界ギリギリの量子化技術のおかげで、エッジデバイスへのオフライン組み込みがいよいよ現実的になってきた。

▸こんな人・用途に

– スマホやPC上でオフライン動作するプライバシーに配慮した翻訳アプリの開発
– WMT26の「動画字幕翻訳タスク」など、翻訳コンペティションへの参加

◆入手方法・リンク

Hugging FaceとModelScopeですぐにダウンロード可能。用途に合わせてFP8やGGUF（2bit、1.25bit含む）など、豊富な量子化バリエーションが用意されている。

公式発表を読む

SOURCE: Tencent (2026-05-11)

← LLM Watch トップへ

Tencent

Tencent が Sequential-Hidden-Decoding-8B-n8-Instruct をリリース ── 同じTransformerでシーケンス長を8倍に伸ばす異色のアプローチ
ByLLM Watch編集部 2026年3月31日2026年3月31日

TencentがSequential Hidden Decoding手法でシーケンス長を8倍に拡張した8Bモデルを公開。Qwen3ベースでコンテキスト131Kトークン対応。

続きを読む Tencent が Sequential-Hidden-Decoding-8B-n8-Instruct をリリース ── 同じTransformerでシーケンス長を8倍に伸ばす異色のアプローチ
Mistral

Mistral が Leanstral-1.5-119B-A6B をリリース ── 数学の証明すらこなす最強のコードエージェント
ByLLM Watch編集部 2026年7月4日

Mistralが数学の定理証明やコード検証に特化したエージェントモデル「Leanstral-1.5-119B-A6B」を公開。119BパラメータのMoEモデル。

続きを読む Mistral が Leanstral-1.5-119B-A6B をリリース ── 数学の証明すらこなす最強のコードエージェント
Zhipu AI

Zhipu AI が SCAIL-2 をリリース ── 骨格推定なしでエンドツーエンドのキャラクターアニメーションを実現
ByLLM Watch編集部 2026年6月9日

Zhipu AIがオープンソースのキャラクター動画モデル「SCAIL-2」を公開。骨格抽出なしでエンドツーエンド駆動し、動物の動きにも対応。

続きを読む Zhipu AI が SCAIL-2 をリリース ── 骨格推定なしでエンドツーエンドのキャラクターアニメーションを実現
Alibaba (Qwen)

Alibaba (Qwen) が Qwen-Scope (SAE) をリリース ── Qwen3-30B-A3Bの内部を131,072次元で解読
ByLLM Watch編集部 2026年4月30日

AlibabaがQwen3-30B-A3B向けSAE「Qwen-Scope」を公開。131,072次元のスパース特徴でLLM内部を解読する試み。

続きを読む Alibaba (Qwen) が Qwen-Scope (SAE) をリリース ── Qwen3-30B-A3Bの内部を131,072次元で解読
MiniMax

MiniMax が MiniMax-M3-MXFP8 をリリース ── 約428Bパラメータのネイティブマルチモーダル、100万コンテキストをスパースアテンションで高速処理
ByLLM Watch編集部 2026年6月12日

MiniMaxが約428BパラメータのネイティブマルチモーダルモデルMiniMax-M3-MXFP8をリリース。独自のスパースアテンションで100万コンテキストを高速処理。

続きを読む MiniMax が MiniMax-M3-MXFP8 をリリース ── 約428Bパラメータのネイティブマルチモーダル、100万コンテキストをスパースアテンションで高速処理
Tencent

Tencent が Penguin-Encoder をリリース ── LLMそのものをビジョンエンコーダーに転用した新機軸
ByLLM Watch編集部 2026年3月7日2026年3月10日

Tencentが「Penguin-Encoder」を公開。CLIPではなくLLMをベースとした独自のビジョンエンコーダ。

続きを読む Tencent が Penguin-Encoder をリリース ── LLMそのものをビジョンエンコーダーに転用した新機軸

コメントを残すコメントをキャンセル