Hugging Face が Cohere の開発者向けモデル North Mini Code をリリース ── 3Bのアクティブパラメータで120B超えの巨大モデルをぶっちぎるコーディング特化MoE
今回Cohereから、かなりエグいコーディング特化モデルが登場した。なんと総パラメータ30Bのうち、常に3Bしか動かさないMoEアーキテクチャで、120B超えの巨大モデルたちをスコアで抜き去っている。効率と性能の両立がここまで来ているとは、本当に恐れ入る。
▸何が変わったのか
注目すべきは、Artificial AnalysisのCoding Indexで「33.4」というスコアを叩き出した点。Nemotron 3 Super (120B-A12B) や Mistral Small 4 (119B-A6B)、Devstral 2 (123B) といった、はるかに大きいモデルを軽く上回る結果だ。アーキテクチャは「128のエキスパートのうち8つをトークンごとに選択するMoE」で、スライディングウィンドウアテンションとグローバルアテンションを3:1の割合で採用している。学習パイプラインもこだわりが強く、2段階のSFTのあとに、ソフトウェアエンジニアリングやターミナルタスクに特化した強化学習(RLVR)を回している。
◈前モデル / 競合との比較
同サイズ帯のオープンソースモデルである Qwen3.5 (35B-A3B) や Gemma 4 (26B-A4B)、Devstral Small 2 (24B Dense) を凌駕。さらに驚きなのが、Nemotron 3 Super (120B-A12B) や Mistral Small 4 (119B-A6B) といった、パラメータ数で3〜4倍ある巨大モデルをもスコアで上回っている点だ。
◈技術背景と意義
MoE(Mixture-of-Experts)は、簡単に言うと「AIの頭脳を専門家のチームに分けて、必要なときに必要な専門家だけを起こす」という仕組み。これにより、巨大な知能を持ちながら動作は軽い、というエコな状態を実現できる。North Mini Codeは、この仕組みをコーディングという特定タスクに極限まで最適化したモデルだ。単なるコード補完ツールではなく、ターミナル操作から複雑なワークフローまでこなす「エージェント」として機能するよう設計されているのがポイント。
▸こんな人・用途に
ターミナル上で自律的に動くコーディングエージェント(OpenCodeなど)の基盤モデルとしての利用。複雑なソフトウェア開発ワークフローを組んで自動化したいエンジニア。リソースが限られた環境でも、巨大モデル並みの推論力を持つコード生成ツールを導入したいプロジェクト。
◆入手方法・リンク
Hugging Faceにて「Apache 2.0」ライセンスで公開されている。OpenCodeを通してすぐに試すことができるので、気になる開発者はさっそく触ってみるのがおすすめ。
SOURCE: Hugging Face (2026-06-09)

