Introducing North Mini Code: Cohere’s First Model For Developers カバー画像

Hugging Face が Cohere の開発者向けモデル North Mini Code をリリース ── 3Bのアクティブパラメータで120B超えの巨大モデルをぶっちぎるコーディング特化MoE

ByLLM Watch編集部 2026年6月10日

HUGGING FACE

最終更新: 2026年06月10日 06:02　元記事 →

今回Cohereから、かなりエグいコーディング特化モデルが登場した。なんと総パラメータ30Bのうち、常に3Bしか動かさないMoEアーキテクチャで、120B超えの巨大モデルたちをスコアで抜き去っている。効率と性能の両立がここまで来ているとは、本当に恐れ入る。

▸何が変わったのか

注目すべきは、Artificial AnalysisのCoding Indexで「33.4」というスコアを叩き出した点。Nemotron 3 Super (120B-A12B) や Mistral Small 4 (119B-A6B)、Devstral 2 (123B) といった、はるかに大きいモデルを軽く上回る結果だ。アーキテクチャは「128のエキスパートのうち8つをトークンごとに選択するMoE」で、スライディングウィンドウアテンションとグローバルアテンションを3:1の割合で採用している。学習パイプラインもこだわりが強く、2段階のSFTのあとに、ソフトウェアエンジニアリングやターミナルタスクに特化した強化学習（RLVR）を回している。

◈前モデル / 競合との比較

同サイズ帯のオープンソースモデルである Qwen3.5 (35B-A3B) や Gemma 4 (26B-A4B)、Devstral Small 2 (24B Dense) を凌駕。さらに驚きなのが、Nemotron 3 Super (120B-A12B) や Mistral Small 4 (119B-A6B) といった、パラメータ数で3〜4倍ある巨大モデルをもスコアで上回っている点だ。

◈技術背景と意義

MoE（Mixture-of-Experts）は、簡単に言うと「AIの頭脳を専門家のチームに分けて、必要なときに必要な専門家だけを起こす」という仕組み。これにより、巨大な知能を持ちながら動作は軽い、というエコな状態を実現できる。North Mini Codeは、この仕組みをコーディングという特定タスクに極限まで最適化したモデルだ。単なるコード補完ツールではなく、ターミナル操作から複雑なワークフローまでこなす「エージェント」として機能するよう設計されているのがポイント。

▸こんな人・用途に

ターミナル上で自律的に動くコーディングエージェント（OpenCodeなど）の基盤モデルとしての利用。複雑なソフトウェア開発ワークフローを組んで自動化したいエンジニア。リソースが限られた環境でも、巨大モデル並みの推論力を持つコード生成ツールを導入したいプロジェクト。

◆入手方法・リンク

Hugging Faceにて「Apache 2.0」ライセンスで公開されている。OpenCodeを通してすぐに試すことができるので、気になる開発者はさっそく触ってみるのがおすすめ。

公式発表を読む

SOURCE: Hugging Face (2026-06-09)

← LLM Watch トップへ

OpenAI

OpenAI が How Descript enables multilingual video dubbing at scale をリリース ── 多言語吹き替えの自動化がここまで来た
ByLLM Watch編集部 2026年3月7日2026年3月10日

DescriptがOpenAIモデルを使い、意味とタイミングを最適化した多言語吹き替えを実現。

続きを読む OpenAI が How Descript enables multilingual video dubbing at scale をリリース ── 多言語吹き替えの自動化がここまで来た
OpenAI

OpenAI が Endava の事例を公開 ── AIエージェントでソフトウェア開発を再設計
ByLLM Watch編集部 2026年6月4日

OpenAIが公開したEndavaの事例。AIエージェントやChatGPT Enterpriseを活用し、開発の高速化とAIネイティブ文化の構築を実現。

続きを読む OpenAI が Endava の事例を公開 ── AIエージェントでソフトウェア開発を再設計
Hugging Face

Hugging Face が Holotron-12B – High Throughput Computer Use Agent をリリース ── PC操作エージェントの推論効率が劇的に向上
ByLLM Watch編集部 2026年3月17日

H Company、NVIDIA製ベースのPC操作エージェントHolotron-12Bを発表。ハイブリッドSSMで効率化。

続きを読む Hugging Face が Holotron-12B – High Throughput Computer Use Agent をリリース ── PC操作エージェントの推論効率が劇的に向上
OpenAI

OpenAI が Enterprises power agentic workflows in Cloudflare Agent Cloud with OpenAI をリリース ── Cloudflare上でGPT-5.4とCodexが利用可能に
ByLLM Watch編集部 2026年4月14日

CloudflareがAgent CloudにOpenAIのGPT-5.4とCodexを統合。企業が安全かつ高速に実務向けAIエージェントを構築・展開できる環境が整った。

続きを読む OpenAI が Enterprises power agentic workflows in Cloudflare Agent Cloud with OpenAI をリリース ── Cloudflare上でGPT-5.4とCodexが利用可能に
Hugging Face

Hugging Face が LeRobot v0.6.0: Imagine, Evaluate, Improve をリリース ── ロボットが未来を想像して動く時代へ
ByLLM Watch編集部 2026年7月6日

Hugging FaceがLeRobot v0.6.0をリリース。未来を予測するワールドモデルポリシーを導入し、ロボット学習のループを閉じる大幅アップデート。

続きを読む Hugging Face が LeRobot v0.6.0: Imagine, Evaluate, Improve をリリース ── ロボットが未来を想像して動く時代へ
OpenAI

OpenAI が Working with Codex をリリース ── Codexを使いこなす公式ガイド登場
ByLLM Watch編集部 2026年4月24日

OpenAIがCodex公式ガイドを公開。workspace構築からプロジェクト管理まで丁寧に解説。

続きを読む OpenAI が Working with Codex をリリース ── Codexを使いこなす公式ガイド登場

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

◆入手方法・リンク

類似投稿

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル