Hugging Face が Granite 4.1 LLMs: How They’re Built を公開 ── 15Tトークン学習の8B小型モデルが前世代32Bを凌駕

HUGGING FACE

最終更新: 2026年05月01日 10:02　元記事 →

IBMのGraniteチームが、最新LLM「Granite 4.1」の技術的な全貌を解説する記事を公開した。なんと8B（80億パラメータ）の小型モデルが、前世代の32Bモデルを凌駕する性能を叩き出している。15兆トークンを5段階のパイプラインで学習させたその職人技、本当に熱い。

▸何が変わったのか

今回登場したGranite 4.1は、3B、8B、30Bの3サイズ展開。約15T（15兆）トークンによる5フェーズの事前学習が肝で、第5フェーズでコンテキストウィンドウを最大512Kトークンまで拡張している。SFTには約4.1Mの厳選サンプルを使い、GRPOとDAPO lossを活用した強化学習を適用。驚くべきは、8Bのinstructモデルが前世代の「Granite 4.0-H-Small (32B-A9B MoE)」に匹敵、あるいはそれ以上の性能を発揮している点。アーキテクチャにはGQA、RoPE、SwiGLU、RMSNormといった最新構成を盛り込んだ。

◈前モデル / 競合との比較

前世代の「Granite 4.0-H-Small」は32B-A9BのMoE（専門家混合）モデルだった。しかし今回は、シンプルで扱いやすいDense構造の8Bモデルで同等以上のスコアをマーク。圧倒的なパラメータ効率の向上を成し遂げている。

◈技術背景と意義

最近のAIは「小さくて賢い」のがトレンド。Granite 4.1はシンプルなDenseアーキテクチャを採用しつつ、学習データを5段階に分けて超精密にふるいにかけることで、少ないパラメータで圧倒的な性能を引き出した。最大512Kトークン、つまり50万字以上のテキストを一度に処理できるロングコンテキスト対応もヤバい。計算コストを抑えつつ、長文解析や複雑な推論タスクに強い仕上がりになっている。

▸こんな人・用途に

1. 50万字超えの技術マニュアルや契約書を一気に読み込ませる長文ドキュメント解析。
2. 計算リソースが限られるオンプレミス環境やエッジデバイスでのチャットボット構築。
3. 高度な数学的推論やコーディングを伴うプログラミングアシスタント。

▸Redditの反応

投稿自体のスコアは低めだが、コメントは軽いノリで進化を歓迎するムード。8Bというサイズ感に実用性を感じる声が多い。

r/LocalLLaMA▲ 5

「Qwen 3.6 27Bがたった2ヶ月前に出た15倍デカい397Bをエージェント系コーディングで抜いた。これが進化ってやつだな。」

u/FullstackSensei

r/LocalLLaMA▲ 3

「うちのFartbot 5BはX.AIの500B Grokと同等のオナラ性能を叩き出す。Claude Opus 4.6レベルのフラットゥランスにもほぼ匹敵するぞ。驚け。」

u/Fit-Produce420

r/LocalLLaMA▲ 2

「ちょっと試すか。8Bなら貧弱なGPUで悩んでる9割の奴らにちょうどいいサイズだろ。」

u/sn2006gy

◆入手方法・リンク

Hugging Faceの「Granite 4.1 HF Collection」やGitHubリポジトリからモデルを入手可能。提供テキストによればApache 2.0ライセンスで公開されており、公式のGranite Docsも用意されている。

公式発表を読む

SOURCE: Hugging Face (2026-04-29)

← LLM Watch トップへ

Hugging Face が Granite 4.1 LLMs: How They’re Built を公開 ── 15Tトークン学習の8B小型モデルが前世代32Bを凌駕

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

▸Redditの反応

◆入手方法・リンク

Hugging Face が The Open Agent Leaderboard をリリース ── モデルじゃなく「エージェント全体」を評価する新基準

OpenAI が Creating with Sora Safely をリリース

OpenAI が OpenAI and Hugging Face partner to address security incident during model evaluation をリリース ── モデル評価中のセキュリティインシデントから防御の教訓を共有

NVIDIAがコード学習データ「Code Concepts」を公開 ── 概念ベースの合成で効率化

OpenAI が Rakuten fixes issues twice as fast with Codex をリリース ── 楽天の開発速度が倍になるってマジ？

Hugging Face が Falcon Perception をリリース ── 画像と言語を1つのTransformerで処理する新アーキテクチャ

コメントを残すコメントをキャンセル

▸何が変わったのか

◈前モデル / 競合との比較

◈技術背景と意義

▸こんな人・用途に

▸Redditの反応

◆入手方法・リンク

類似投稿

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル