Mistral が Mistral-Medium-3.5 をリリース ── 推論・エージェント・マルチモーダルを統合した128Bの大躍進
Mistralが、自慢のフラッグシップモデル「Mistral Medium 3.5」をHugging Faceに公開した。推論、コーディング、チャット機能をたった1つの重みファイルにまとめ上げ、さらには256kコンテキストと画像認識まで搭載してきた。これだけの機能をドーンと詰め込んでくるのは、正直かなり熱い。
▸何が変わったのか
今回リリースされたのは128BパラメータのDenseモデル「Mistral Medium 3.5」。最大のポイントは、複雑な推論やエージェント用途で力を発揮する「Reasoning Mode」と、サクッと返答するモードをリクエストごとに切り替えられる点だ。コンテキストウィンドウは256k。さらに画像入力にも対応し、可変サイズの画像を処理するためのビジョンエンコーダーをゼロから学習させている。これまでLe Chatで使われていたMagistralや、コーディングエージェントのDevstral 2は、この新モデルに統合・置き換えられる形になる。
◈前モデル / 競合との比較
前身となるMistral Medium 3.1や、対話用のMagistral、コーディング特化のDevstral 2の機能を一本化。モデルを切り替えることなく、1つのモデルで指示追従から推論、コーディングまでをこなせるようになった。
◈技術背景と意義
今回同時にリリースされた「EAGLE」は、モデルの推論速度を爆速化する「投機的デコーディング(Speculative Decoding)」用の仕組み。重い128Bモデルの出力を、軽量なヘッドが先回りして予測することで、圧倒的なスピードアップを実現するアプローチだ。実行環境としてはvLLMのナイトリービルドやSGLangが推奨されており、本番環境での実用的なスループットが期待できる。
▸こんな人・用途に
– reasoning_effortを「high」に設定しての、複雑な論理演算や自律型コーディングエージェントの構築
– 256kのロングコンテキストと画像解析を活かした、大量資料のマルチモーダルRAG(検索拡張生成)
– JSON出力やFunction Callingを駆動させる、外部ツール連携が必須なタスク向けアシスタント
▸Redditの反応
Mistral Mediumの新作リリースが近づいているとの報せに、r/LocalLLaMAのユーザーたちは大盛り上がり。24Bサイズのローカルモデルへの期待値が爆上がりしていて、マジで待ちきれないといったワクワク感が伝わってくる。
「画像を見る限り、Mediumは3.5でSmallが4ってことだね。バージョニングがちょっと独特だけど、サイズごとのモデル展開がこれからどうなっていくのか気になる。」
「Mistral 3.5の24Bモデル、マジで楽しみに待ってるよ🙏🙏 ローカルでサクサク動かせるこのサイズ感は一番使い勝手が良いから、性能向上には本当に期待してる。」
「アツい!「早く出ないかな」って願ってたら本当に来たわ笑。自分が引き寄せたのかもね。早く手に入れて試してみたい!」
◆入手方法・リンク
Modified MIT LicenseのもとHugging Faceで公開されており、商用・非商用問わず利用可能(一部の高収益企業を除く)。推論にはvLLM(nightly)やSGLangの利用が推奨されている。
SOURCE: Mistral (2026-04-27)