Tencent が Penguin-VL-2B をリリース ── LLMを「目」に改造した画期的な効率化モデル
TencentがLLMベースのビジョンエンコーダを採用したVLM「Penguin-VL-2B」をOSSで公開。効率的な動画理解が特徴。
TencentがLLMベースのビジョンエンコーダを採用したVLM「Penguin-VL-2B」をOSSで公開。効率的な動画理解が特徴。
Tencentが「Penguin-Encoder」を公開。CLIPではなくLLMをベースとした独自のビジョンエンコーダ。
TencentがPenguin-VL-8BをOSS公開。LLMベースの視覚エンコーダと動画理解機能を搭載。
Tencent、画像編集のための新フレームワーク「HY-WU」をOSSで公開。学習なしでアダプターを生成する記憶メカニズムが革新的。
Tencent、ノイズに強い音声トークナイザ「StableToken」をOSSとして公開。競合を凌駕する耐性を獲得。