MiniMax が MiniMax-M2.7 をリリース ── 自己進化するエージェント特化モデル、本番障害を3分未満で復旧
モデルが自分自身の学習プロセスを改善し、自律的にコードを最適化する──まるでSFの世界みたいな話だけど、MiniMaxがそれを現実にした。新モデル「MiniMax-M2.7」は、エージェントとしての実戦能力に徹底的に振り切った設計で、本番環境のインシデント復旧を3分未満で叩き出したらしい。正直、この数字には驚いた。
▸何が変わったのか
最大の特徴は「モデル自己進化」の仕組み。開発中にモデル自身にメモリを更新させ、RL実験用の複雑なスキルを数十個構築させ、実験結果に基づいて学習プロセスを改善させる循環を回している。内部バージョンではプログラミングスキャフォールドを100ラウンド以上自律最適化し、30%の性能向上を達成。MLE Bench Lite(22のMLコンペ)ではメダル率66.6%を記録し、Opus-4.6とGPT-5.4に次ぐ成績。エージェントチームによるマルチエージェント協調もネイティブサポートし、安定したロールアイデンティティと自律的な意思決定が可能。
◈前モデル / 競合との比較
SWE-Proで56.22%を達成し、GPT-5.3-Codexと同等のスコア。実際のエンジニアリングベンチマークでは、SWE Multilingual(76.5)やMulti SWE Bench(52.7)でより強力な成績を残している。GDPval-AAのELO 1495はオープンソースモデル中最高で、GPT-5.3を上回る。VIBE-Pro(55.6%)でOpus 4.6にほぼ匹敵し、MM Claw(62.7%)はSonnet 4.6に肉薄する数字。
◈技術背景と意義
従来のAIモデルは「人間が用意したデータで学習する」のが基本だった。でもM2.7は「自分の失敗を分析して自分を改良する」というループを内部に持っている。コードを書いて実行し、失敗したら原因を分析し、修正して再評価する──このサイクルを自律的に回せるのが最大のポイント。エージェントとして使う場面では、ログ分析から原因特定、修正までを一気通貫でこなせる。
▸こんな人・用途に
SREやプラットフォームエンジニアリングの現場で、障害対応の自動化に使える。ログとメトリクスの相関分析、トレース分析、DB内での原因検証まで自律的に実行できるため。また、Word・Excel・PPTの編集を含む事務作業の自動化にも強く、GDPval-AAでELO 1495を記録。MM Clawベンチマークでは40以上の複雑スキルに対して97%のスキルコンプライアンスを維持している。
▸Redditの反応
MiniMax-M2.7のオープンウェイト化が発表され、r/LocalLLaMAではかなりの盛り上がりを見せている。ベンチマークスコアへの驚きの声や、実際の使用感に対する期待、そして次期モデルへの熱い視線が交錯する熱量の高い空気感だ。
「「うわっ」と思わず声が出るレベルの衝撃。何かとんでもない数値を見て度肝を抜かれた様子。これにはワクワクするね。」
「ベンチマークの数字は立派だけど、実際の使用感こそが本当のテスト。最近はテストで高得点でも、少し変わった入力で崩れるモデルが多いから、リアルなレビューを待ってる。」
「オープンウェイトで公開されるという知らせに「めちゃくちゃ良いニュースだ!」と大歓喜。ローカルモデル界隈の期待値の高さが伝わってくる。」
「次期モデルのM3はマルチモーダル化、より大型化、そしてオープンウェイトでの提供になるらしい。かなりアグレッシブな展開で、これからの進化が楽しみ。」
「実際に大規模クライアント向けに2.5を導入してみたら、ツール利用やRAGがめちゃくちゃ優秀で処理も高速だったとのこと。画像と音声の入力さえあれば完璧らしい。」
◆入手方法・リンク
HuggingFace(https://huggingface.co/MiniMaxAI/MiniMax-M2.7)からモデルをダウンロード可能。API経由で使うならMiniMax Platform(https://platform.minimax.io/)を利用。エージェントとして試すならMiniMax Agent(https://agent.minimax.io/)が用意されている。キャラクター一貫性を試せるインタラクティブデモ「OpenRoom」もopenroom.aiで公開中。
SOURCE: MiniMax (2026-04-09)