Tencent が Hy-MT2-1.8B をリリース ── 1.25ビット量子化で440MB、デバイス上で動く33言語翻訳モデル
Tencentが多言語翻訳モデルの新シリーズ「Hy-MT2」をHugging Faceなどで公開した。今回リリースされたのは1.8B、7B、30B-A3B (MoE)の3サイズ。なかでも軽量な1.8Bモデルの破壊力がすごい。極限量子化をかけると、なんと容量わずか440MBまで圧縮できる。スマホのローカルでもサクサク動く翻訳特化モデルの登場だ。
▸何が変わったのか
展開されているのは1.8B、7B、30B-A3B (MoE)という3つのサイズ。33言語の相互翻訳をサポートし、複雑な実環境を想定した「高速思考」設計になっている。目を見張るのは「AngelSlim」を用いた1.25ビットの極限量子化テクニック。1.8Bモデルのストレージ要件を440MBまで削減しつつ、推論速度を1.5倍も引き上げている。また、翻訳時の指示追従能力を評価するベンチマーク「IFMTBench」も同時にオープンソース化された。
◈前モデル / 競合との比較
公式のアナウンスによれば、7Bおよび30B-A3BモデルはDeepSeek-V4-ProやKimi K2.6といった強豪オープンソースモデルを凌駕。1.8BモデルでもMicrosoftやDoubaoなどの主流な商用APIを総合的に上回る性能を示している。
◈技術背景と意義
巨大なLLMに翻訳させるのも良いけれど、やはり特化型モデルの軽量・高速さは魅力的。Hy-MT2の7B以上のモデルはfast-thinkingモードにおいてDeepSeek-V4-ProやKimi K2.6を上回る性能を叩き出す。さらに軽量な1.8Bモデルに至っては、MicrosoftやDoubaoといった主要商用APIを総合的に凌駕するという。限界ギリギリの量子化技術のおかげで、エッジデバイスへのオフライン組み込みがいよいよ現実的になってきた。
▸こんな人・用途に
– スマホやPC上でオフライン動作するプライバシーに配慮した翻訳アプリの開発
– WMT26の「動画字幕翻訳タスク」など、翻訳コンペティションへの参加
◆入手方法・リンク
Hugging FaceとModelScopeですぐにダウンロード可能。用途に合わせてFP8やGGUF(2bit、1.25bit含む)など、豊富な量子化バリエーションが用意されている。
SOURCE: Tencent (2026-05-11)