Mistral-Small-4-119B-2603-eagle カバー画像

Mistral

Mistral が Mistral-Small-4-119B-2603-eagle をリリース ── 推論・コード・ビジネスを1つに統合したハイブリッドモンスター

Byren_admin 2026年3月17日

MISTRALOSS

最終更新: 2026年03月17日 06:02　元記事 →

Mistralが完全オープンソースの新モデル「Mistral Small 4」を公開して、その完成度の高さにざわついている。なんとこれまで別々だった「チャット」「推論」「コーディング（Devstral）」という3つの系譜を、たった一つのモデルに統合してしまったんだ。しかも前モデルから爆速化されていて、これはもう手放せない代わりになりそう。

▸何が変わったのか

今回のモデルは総パラメータ数119B、アクティブパラメータ6.5Bという構成で、128の専門家（Experts）のうち4つをアクティブにするMoEアーキテクチャを採用。コンテキスト長は256kを誇り、テキストと画像の両方を入力できるマルチモーダル機能も備えている。パフォーマンスに関しては、Mistral Small 3と比較してレイテンシ最適化時に完了時間が40%短縮、スループット最適化時には1秒あたりのリクエスト処理数が3倍に大幅向上したとのこと。さらに、リクエストごとに「Reasoning Mode」のON/OFFを切り替えられる機能や、Apache 2.0ライセンスでの完全なOSS提供も大きな進化点だ。

◈前モデル / 競合との比較

前バージョンであるMistral Small 3と比較して、レイテンシ最適化環境でエンドツーエンドの完了時間が40%削減され、スループット最適化環境では1秒あたりの処理リクエスト数が3倍に向上している。

◈技術背景と意義

これまでは「普段使いの軽いモデル」と「複雑な思考をする重いモデル」を使い分けるのが一般的だったが、Mistral Small 4はこの両方の役割を1つでこなせるように設計されているんだ。ポイントは「MoE」という技術で、実際に計算を行う脳の一部を必要な時だけ選んで使うため、全体では119Bという巨大な知識を持ちながらも、処理速度は驚くほど軽快に保たれている。これにより、ユーザーはその場のタスクに合わせて「高速回答」か「熟考モード」かを即座に切り替えられるようになった。

▸こんな人・用途に

SWE自動化やコードベースの探索を行う開発者、ドキュメント理解や汎用的なチャットアシスタントを必要とする企業、数学や研究分野を扱う研究者に最適。

◆入手方法・リンク

Hugging Faceからモデルの重みを入手可能で、推論にはvLLMライブラリの使用が推奨されている。ツール呼び出しや推論解析の修正が含まれたカスタムDockerイメージ「mistralllm/vllm-ms4:latest」も提供されている。

公式発表を読む

SOURCE: Mistral (2026-03-04)

← LLM Watch トップへ

Tencent

Tencent が Penguin-Encoder をリリース ── LLMそのものをビジョンエンコーダーに転用した新機軸
Byren_admin 2026年3月7日2026年3月10日

Tencentが「Penguin-Encoder」を公開。CLIPではなくLLMをベースとした独自のビジョンエンコーダ。

続きを読む Tencent が Penguin-Encoder をリリース ── LLMそのものをビジョンエンコーダーに転用した新機軸
Tencent

Tencent が HY-WU をリリース ── 学習不要でアダプターを生成する「ニューラルメモリ」搭載
Byren_admin 2026年3月6日2026年3月10日

Tencent、画像編集のための新フレームワーク「HY-WU」をOSSで公開。学習なしでアダプターを生成する記憶メカニズムが革新的。

続きを読む Tencent が HY-WU をリリース ── 学習不要でアダプターを生成する「ニューラルメモリ」搭載
Tencent

Tencent が Sequential-Hidden-Decoding-8B-n4 をリリース ── 推論ステップを「隠し」て性能を爆上げ
Byren_admin 2026年3月10日

Tencentが「Sequential-Hidden-Decoding-8B-n4」を公開。Embedding追加のみで性能を引き出す新手法。

続きを読む Tencent が Sequential-Hidden-Decoding-8B-n4 をリリース ── 推論ステップを「隠し」て性能を爆上げ
Tencent

Tencent が HY-World-2.0 をリリース ── 動画じゃない、遊べるリアル3Dアセットを直接生成
Byren_admin 2026年4月16日

Tencentがオープンソースで公開したHY-World 2.0は、テキストや画像から編集可能なリアル3D空間を直接生成する革新的なモデルです。

続きを読む Tencent が HY-World-2.0 をリリース ── 動画じゃない、遊べるリアル3Dアセットを直接生成
Tencent

Tencent が DisCa をリリース ── 動画生成の高速化、「学習できるキャッシュ」で品質を死守
Byren_admin 2026年4月15日

Tencent HunyuanがCVPR 2026採択のDisCaをOSS公開。学習可能なFeature Cachingで動画生成を高速化しつつ品質を維持する新手法。

続きを読む Tencent が DisCa をリリース ── 動画生成の高速化、「学習できるキャッシュ」で品質を死守
Alibaba (Qwen)

Alibaba (Qwen) が Qwen3.5-0.8B-Base をリリース ── 0.8Bで最大100万トークン対応の超軽量モデル
Byren_admin 2026年3月2日2026年3月10日

Alibabaが0.8Bパラメータの「Qwen3.5-0.8B-Base」を公開。100万トークン超対応で衝撃。

続きを読む Alibaba (Qwen) が Qwen3.5-0.8B-Base をリリース ── 0.8Bで最大100万トークン対応の超軽量モデル

コメントを残すコメントをキャンセル