Hugging Face が Granite 4.1 LLMs: How They’re Built を公開 ── 15Tトークン学習の8B小型モデルが前世代32Bを凌駕
IBMのGraniteチームが、最新LLM「Granite 4.1」の技術的な全貌を解説する記事を公開した。なんと8B(80億パラメータ)の小型モデルが、前世代の32Bモデルを凌駕する性能を叩き出している。15兆トークンを5段階のパイプラインで学習させたその職人技、本当に熱い。
▸何が変わったのか
今回登場したGranite 4.1は、3B、8B、30Bの3サイズ展開。約15T(15兆)トークンによる5フェーズの事前学習が肝で、第5フェーズでコンテキストウィンドウを最大512Kトークンまで拡張している。SFTには約4.1Mの厳選サンプルを使い、GRPOとDAPO lossを活用した強化学習を適用。驚くべきは、8Bのinstructモデルが前世代の「Granite 4.0-H-Small (32B-A9B MoE)」に匹敵、あるいはそれ以上の性能を発揮している点。アーキテクチャにはGQA、RoPE、SwiGLU、RMSNormといった最新構成を盛り込んだ。
◈前モデル / 競合との比較
前世代の「Granite 4.0-H-Small」は32B-A9BのMoE(専門家混合)モデルだった。しかし今回は、シンプルで扱いやすいDense構造の8Bモデルで同等以上のスコアをマーク。圧倒的なパラメータ効率の向上を成し遂げている。
◈技術背景と意義
最近のAIは「小さくて賢い」のがトレンド。Granite 4.1はシンプルなDenseアーキテクチャを採用しつつ、学習データを5段階に分けて超精密にふるいにかけることで、少ないパラメータで圧倒的な性能を引き出した。最大512Kトークン、つまり50万字以上のテキストを一度に処理できるロングコンテキスト対応もヤバい。計算コストを抑えつつ、長文解析や複雑な推論タスクに強い仕上がりになっている。
▸こんな人・用途に
1. 50万字超えの技術マニュアルや契約書を一気に読み込ませる長文ドキュメント解析。
2. 計算リソースが限られるオンプレミス環境やエッジデバイスでのチャットボット構築。
3. 高度な数学的推論やコーディングを伴うプログラミングアシスタント。
▸Redditの反応
投稿自体のスコアは低めだが、コメントは軽いノリで進化を歓迎するムード。8Bというサイズ感に実用性を感じる声が多い。
「Qwen 3.6 27Bがたった2ヶ月前に出た15倍デカい397Bをエージェント系コーディングで抜いた。これが進化ってやつだな。」
「うちのFartbot 5BはX.AIの500B Grokと同等のオナラ性能を叩き出す。Claude Opus 4.6レベルのフラットゥランスにもほぼ匹敵するぞ。驚け。」
「ちょっと試すか。8Bなら貧弱なGPUで悩んでる9割の奴らにちょうどいいサイズだろ。」
◆入手方法・リンク
Hugging Faceの「Granite 4.1 HF Collection」やGitHubリポジトリからモデルを入手可能。提供テキストによればApache 2.0ライセンスで公開されており、公式のGranite Docsも用意されている。
SOURCE: Hugging Face (2026-04-29)
