Granite 4.0 1B Speech: Compact, Multilingual, and Built for the Edge カバー画像

Hugging Face

Hugging Face が Granite 4.0 1B Speech: Compact, Multilingual, and Built for the Edge をリリース ── パラメータ半減で日本語対応も実現した小型音声モデル

ByLLM Watch編集部 2026年3月10日2026年3月10日

HUGGING FACE

最終更新: 2026年03月10日 04:07　元記事 →

IBMのGraniteシリーズに新たなモデル「Granite 4.0 1B Speech」が登場しました。前モデルからパラメータ数を半分に削減したにもかかわらず、英語の認識精度が向上しているというから驚きです。日本語対応も追加され、リソースが限られたエッジデバイスでの利用を想定したかなり実用的なモデルに仕上がっています。

▸何が変わったのか

新モデル「Granite 4.0 1B Speech」は、前バージョンの「granite-speech-3.3-2b」と比べてパラメータ数が半分となり、よりコンパクトになっています。それでいて英語の書き起こし精度は向上し、「speculative decoding」による推論の高速化も実現。サポート言語は英語、フランス語、ドイツ語、スペイン語、ポルトガル語に加え、新たに「日本語」もサポートされました。さらに「keyword list biasing」機能により、名前や頭字語などの認識精度が底上げされています。

◈前モデル / 競合との比較

前世代の「granite-speech-3.3-2b」と比較して、パラメータ数は半減しつつ精度と速度は向上しています。「OpenASR leaderboard」では1位を獲得するなど、同規模あるいはそれ以上のパラメータ数を持つモデルと比べても遜色ない性能を発揮しています。

◈技術背景と意義

このモデルは音声認識（ASR）と双方向音声翻訳（AST）に特化しており、少ないパラメータ数ながら大型モデルに匹敵する性能を目指しています。Word Error Rate (WER)という指標（数値が低いほど精度が高い）では非常に好成績を残しており、リソースが限られたデバイスでも高精度な処理が可能です。Apache 2.0ライセンスで提供されているため、商用利用を含めて自由にカスタマイズして使えるのも大きな魅力でしょう。

▸こんな人・用途に

リソースの限られたエッジデバイスでの多言語音声認識。
日本語を含む多言語会議のリアルタイム文字起こしや翻訳。
固有名詞や専門用語が頻出するビジネスシーンでの高精度な transcription。

◆入手方法・リンク

Apache 2.0ライセンスで公開されており、transformersやvLLMからすぐに利用可能です。詳細なアーキテクチャやトレーニングデータ、使用例はmodel cardで確認できます。

公式発表を読む

SOURCE: Hugging Face (2026-03-09)

← LLM Watch トップへ

Hugging Face

Hugging Face が Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries をリリース
ByLLM Watch編集部 2026年3月10日2026年3月10日

Hugging FaceのKeep the Tokens Flowing: Lessons from 16 Open-Source RL Librariesリリース情報

続きを読む Hugging Face が Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries をリリース
OpenAI

OpenAI が AutoScout24 scales engineering with AI-powered workflows をリリース ── CodexとChatGPTで開発現場を変革
ByLLM Watch編集部 2026年5月13日

AutoScout24 GroupがCodexとChatGPTを活用し、開発サイクルの高速化やコード品質向上を実現した事例の紹介。

続きを読む OpenAI が AutoScout24 scales engineering with AI-powered workflows をリリース ── CodexとChatGPTで開発現場を変革
OpenAI

OpenAI が Nextdoor における Codex 活用事例を公開 ── 再現困難なバグ調査を GPT-5.5 で解決
ByLLM Watch編集部 2026年6月10日

NextdoorのエンジニアがCodexとGPT-5.5を活用し、再現困難なバグ調査を効率化。マルチプラットフォーム開発で成果に集中する事例。

続きを読む OpenAI が Nextdoor における Codex 活用事例を公開 ── 再現困難なバグ調査を GPT-5.5 で解決
Hugging Face

Hugging Face が Introducing Modular Diffusers – Composable Building Blocks for Diffusion Pipelines をリリース ── 拡散モデルのパイプライン構築がまるでレゴのように
ByLLM Watch編集部 2026年3月6日2026年3月10日

Hugging Face、拡散モデルを「ブロック」単位で組み替え可能にする新機能

続きを読む Hugging Face が Introducing Modular Diffusers – Composable Building Blocks for Diffusion Pipelines をリリース ── 拡散モデルのパイプライン構築がまるでレゴのように
OpenAI

OpenAI が Plugins and skills をリリース ── Codexでツール連携と自動化が可能に
ByLLM Watch編集部 2026年4月24日

OpenAIがCodexの「Plugins and skills」を公開。外部ツールの連携でタスクを自動化し、開発のワークフローを劇的に改善する新機能を解説。

続きを読む OpenAI が Plugins and skills をリリース ── Codexでツール連携と自動化が可能に
Hugging Face

Hugging Face 誌で小規模マルチモデル金融シミュレーション「Thousand Token Wood v2」が紹介 ── 異種モデル混在の経済ドラマ
ByLLM Watch編集部 2026年6月7日

Thousand Token Wood v2は4ラボの小規模モデルが混在する仮想経済シミュレーション。異種モデルが生む本物の多様性を体感。

続きを読む Hugging Face 誌で小規模マルチモデル金融シミュレーション「Thousand Token Wood v2」が紹介 ── 異種モデル混在の経済ドラマ

コメントを残すコメントをキャンセル