Introducing North Mini Code: Cohere’s First Model For Developers カバー画像

Hugging Face が Cohere の開発者向けモデル North Mini Code をリリース ── 3Bのアクティブパラメータで120B超えの巨大モデルをぶっちぎるコーディング特化MoE

HUGGING FACE

最終更新: 2026年06月10日 06:02 元記事 →

今回Cohereから、かなりエグいコーディング特化モデルが登場した。なんと総パラメータ30Bのうち、常に3Bしか動かさないMoEアーキテクチャで、120B超えの巨大モデルたちをスコアで抜き去っている。効率と性能の両立がここまで来ているとは、本当に恐れ入る。

何が変わったのか

注目すべきは、Artificial AnalysisのCoding Indexで「33.4」というスコアを叩き出した点。Nemotron 3 Super (120B-A12B) や Mistral Small 4 (119B-A6B)、Devstral 2 (123B) といった、はるかに大きいモデルを軽く上回る結果だ。アーキテクチャは「128のエキスパートのうち8つをトークンごとに選択するMoE」で、スライディングウィンドウアテンションとグローバルアテンションを3:1の割合で採用している。学習パイプラインもこだわりが強く、2段階のSFTのあとに、ソフトウェアエンジニアリングやターミナルタスクに特化した強化学習(RLVR)を回している。

前モデル / 競合との比較

同サイズ帯のオープンソースモデルである Qwen3.5 (35B-A3B) や Gemma 4 (26B-A4B)、Devstral Small 2 (24B Dense) を凌駕。さらに驚きなのが、Nemotron 3 Super (120B-A12B) や Mistral Small 4 (119B-A6B) といった、パラメータ数で3〜4倍ある巨大モデルをもスコアで上回っている点だ。

技術背景と意義

MoE(Mixture-of-Experts)は、簡単に言うと「AIの頭脳を専門家のチームに分けて、必要なときに必要な専門家だけを起こす」という仕組み。これにより、巨大な知能を持ちながら動作は軽い、というエコな状態を実現できる。North Mini Codeは、この仕組みをコーディングという特定タスクに極限まで最適化したモデルだ。単なるコード補完ツールではなく、ターミナル操作から複雑なワークフローまでこなす「エージェント」として機能するよう設計されているのがポイント。

こんな人・用途に

ターミナル上で自律的に動くコーディングエージェント(OpenCodeなど)の基盤モデルとしての利用。複雑なソフトウェア開発ワークフローを組んで自動化したいエンジニア。リソースが限られた環境でも、巨大モデル並みの推論力を持つコード生成ツールを導入したいプロジェクト。

入手方法・リンク

Hugging Faceにて「Apache 2.0」ライセンスで公開されている。OpenCodeを通してすぐに試すことができるので、気になる開発者はさっそく触ってみるのがおすすめ。

SOURCE: Hugging Face (2026-06-09)

← LLM Watch トップへ

類似投稿

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です