Hugging Face が CyberSecQwen-4B をリリース ── 12GB GPUで動く、サイバー防御特化の4Bモデル

ByLLM Watch編集部 2026年5月9日

HUGGING FACE

最終更新: 2026年05月09日 03:03　元記事 →

セキュリティの現場って、絶対に外部のAPIに投げられないような機密データ（マルウェアのペイロードや内部ログなど）を扱わなきゃいけない。そんなシチュエーションで、12GBのコンシューマー向けGPU一枚でサクッとローカル実行できる特化型モデルが登場した。パラメータ数4Bの小さな体躯で、8Bの強力な競合モデルを特定タスクで上回るあたり、かなり熱い。

▸何が変わったのか

CyberSecQwen-4Bは、単一のAMD Instinct MI300Xで学習されたサイバー脅威インテリジェンス（CTI）特化の4Bパラメータモデル。12GBの一般向けGPUでローカル動作するのが最大の強みだ。実際のベンチマーク「CTI-Bench（n=5, temp 0.3）」では、Ciscoの「Foundation-Sec-Instruct-8B」と比較検証が行われている。注目の結果は、CTI-MCQ（2,500項目）でスコア0.5868を叩き出し、8Bモデルの0.4996を+8.7ポイント上回ったこと。CVEからCWEへのマッピングタスク（CTI-RCM、1,000項目）でも0.6664を記録し、8Bモデル（0.6850）の97.3%の精度をしっかりキープ。パラメータ半分でこの成績はガチ。

◈前モデル / 競合との比較

Ciscoの強力なベースラインモデル「Foundation-Sec-Instruct-8B」との直接比較が行われている。CyberSecQwen-4Bはパラメータ数がちょうど半分（4B）にもかかわらず、CTI-MCQスコアで+8.7ポイントの圧勝。マッピングタスク（CTI-RCM）でも、8Bモデルの97.3%の性能を維持している。デプロイのしやすさと性能のバランスで、防衛側にとって非常に現実的な選択肢になっている。

◈技術背景と意義

サイバー攻撃の防御や脆弱性調査では、機密性の高いログやマルウェアのコードをAIに解析させたい場面が頻繁にある。でも、これを外部のAPIに送るのは情報漏洩のリスクが高すぎて論外。かといって、性能を求めて70Bクラスの巨大なモデルを自社で動かそうとすると、高価なGPUが複数必要になってしまう。そこで、特定のセキュリティタスクに絞って学習させた「超特化型の小型モデル」を、手持ちの1枚のGPUで動かすというアプローチが現場の喉から手が出るほど欲しいわけだ。

▸こんな人・用途に

・SOC（セキュリティオペレーションセンター）のアナリストによる、日々の大量アラートのトリアージやCVEの分類作業。
・マルウェアのリバースエンジニアリングや、脆弱性開示（CVE）のドラフト作成を支援するセキュアなローカルツール。
・政府機関や医療など、物理的にインターネットから切り離された（エアギャップ）環境でのオフライン解析。