Mistral-Medium-3 カバー画像

Mistral が Mistral-Medium-3.5 をリリース ── 推論・エージェント・マルチモーダルを統合した128Bの大躍進

MISTRALOSS

最終更新: 2026年04月30日 01:07 元記事 →

Mistralが、自慢のフラッグシップモデル「Mistral Medium 3.5」をHugging Faceに公開した。推論、コーディング、チャット機能をたった1つの重みファイルにまとめ上げ、さらには256kコンテキストと画像認識まで搭載してきた。これだけの機能をドーンと詰め込んでくるのは、正直かなり熱い。

何が変わったのか

今回リリースされたのは128BパラメータのDenseモデル「Mistral Medium 3.5」。最大のポイントは、複雑な推論やエージェント用途で力を発揮する「Reasoning Mode」と、サクッと返答するモードをリクエストごとに切り替えられる点だ。コンテキストウィンドウは256k。さらに画像入力にも対応し、可変サイズの画像を処理するためのビジョンエンコーダーをゼロから学習させている。これまでLe Chatで使われていたMagistralや、コーディングエージェントのDevstral 2は、この新モデルに統合・置き換えられる形になる。

前モデル / 競合との比較

前身となるMistral Medium 3.1や、対話用のMagistral、コーディング特化のDevstral 2の機能を一本化。モデルを切り替えることなく、1つのモデルで指示追従から推論、コーディングまでをこなせるようになった。

技術背景と意義

今回同時にリリースされた「EAGLE」は、モデルの推論速度を爆速化する「投機的デコーディング(Speculative Decoding)」用の仕組み。重い128Bモデルの出力を、軽量なヘッドが先回りして予測することで、圧倒的なスピードアップを実現するアプローチだ。実行環境としてはvLLMのナイトリービルドやSGLangが推奨されており、本番環境での実用的なスループットが期待できる。

こんな人・用途に

– reasoning_effortを「high」に設定しての、複雑な論理演算や自律型コーディングエージェントの構築
– 256kのロングコンテキストと画像解析を活かした、大量資料のマルチモーダルRAG(検索拡張生成)
– JSON出力やFunction Callingを駆動させる、外部ツール連携が必須なタスク向けアシスタント

Redditの反応

Mistral Mediumの新作リリースが近づいているとの報せに、r/LocalLLaMAのユーザーたちは大盛り上がり。24Bサイズのローカルモデルへの期待値が爆上がりしていて、マジで待ちきれないといったワクワク感が伝わってくる。

r/LocalLLaMA▲ 39

「画像を見る限り、Mediumは3.5でSmallが4ってことだね。バージョニングがちょっと独特だけど、サイズごとのモデル展開がこれからどうなっていくのか気になる。」

u/LegacyRemaster
r/LocalLLaMA▲ 30

「Mistral 3.5の24Bモデル、マジで楽しみに待ってるよ🙏🙏 ローカルでサクサク動かせるこのサイズ感は一番使い勝手が良いから、性能向上には本当に期待してる。」

u/ApprehensiveAd3629
r/LocalLLaMA▲ 19

「アツい!「早く出ないかな」って願ってたら本当に来たわ笑。自分が引き寄せたのかもね。早く手に入れて試してみたい!」

u/seamonn

入手方法・リンク

Modified MIT LicenseのもとHugging Faceで公開されており、商用・非商用問わず利用可能(一部の高収益企業を除く)。推論にはvLLM(nightly)やSGLangの利用が推奨されている。

SOURCE: Mistral (2026-04-27)

← LLM Watch トップへ

類似投稿

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です