MedQA: Fine-Tuning a Clinical AI on AMD ROCm — No CUDA Required カバー画像

Hugging Face

Hugging Face で MedQA: Fine-Tuning a Clinical AI on AMD ROCm — No CUDA Required が公開 ── CUDA不要、AMD MI300Xで動く医療特化AI

ByLLM Watch編集部 2026年5月8日

HUGGING FACE

最終更新: 2026年05月08日 17:02　元記事 →

AIモデルの学習といえばNVIDIAのGPUがほぼ必須とされてきたけど、ついに「CUDAなし」で本格的な医療用AIのファインチューニングに成功したプロジェクトが公開された。AMDの超強力なGPU「MI300X」とROCm環境をフル活用したこの取り組み、NVIDIA一強への強烈なカウンターパンチになりそう。

▸何が変わったのか

最大の驚きは、Hugging Faceの主要ツール群（Transformers、PEFT、TRL、Accelerate）がAMD環境でシームレスに動いたこと。環境変数を3つ（”ROCR_VISIBLE_DEVICES”, “HIP_VISIBLE_DEVICES”, “HSA_OVERRIDE_GFX_VERSION”）設定するだけで、既存のCUDA向け学習コードがそのまま実行できる。ベースモデルにはAlibabaの「Qwen3-1.7B」を採用。医療データセット「MedMCQA」から2,000サンプルを抽出してLoRAファインチューニングを行った。AMD Instinct MI300Xの圧倒的な192GBのHBM3メモリを活用できるため、4-bitや8-bitの量子化なし、フルのfp16精度で学習を回せる。実際の学習時間はわずか約5分だったという。

◈前モデル / 競合との比較

従来のAI開発フローではNVIDIAのCUDAが前提だったが、本プロジェクトはAMD ROCm環境で完全に置き換えている。また、VRAMの制限から4-bitや8-bitに量子化して学習させるのが一般的だが、MI300Xの192GB HBM3メモリのおかげでフル精度（fp16）の学習を妥協なく行えている点が大きく異なる。

◈技術背景と意義

これまでオープンソースのAI開発は、NVIDIA製GPUとその専用ソフトウェアである「CUDA」に強く依存してきた。しかし、AMDはNVIDIAに対抗するために「ROCm」というプラットフォームを提供している。今回のポイントは、モデルの精度を落とすための小細工（量子化）をしなくても、192GBという巨大なメモリに余裕のあるAMD GPUを使えば、サクッと高品質な学習ができることを実証した点にある。

▸こんな人・用途に

NVIDIA製GPUを持っていないが、AMD製GPUを使ってローカルでLLMのファインチューニングを試みたい開発者。医療試験の模擬問題や臨床推論のアシストツールを、低コストかつ高速に構築したい医療系スタートアップ。

◆入手方法・リンク

ファインチューニングされたモデルはHugging Face Hub（HK2184/medqa-qwen3-lora）で公開されており、実際の動作デモはHuggingFace Spacesで直接試すことができる。

公式発表を読む

SOURCE: Hugging Face (2026-05-08)

← LLM Watch トップへ

Hugging Face

Hugging Face が ScarfBench: Benchmarking AI Agents for Enterprise Java Framework Migration をリリース ── エンタープライズJava移行を試す超実践ベンチマーク
ByLLM Watch編集部 2026年7月1日

エンタープライズJavaのフレームワーク移行を評価するScarfBenchが登場。ビルドからデプロイまでAIエージェントがこなせるかを測る、超実践的な新ベンチマーク。

続きを読む Hugging Face が ScarfBench: Benchmarking AI Agents for Enterprise Java Framework Migration をリリース ── エンタープライズJava移行を試す超実践ベンチマーク
OpenAI

OpenAI が How Descript enables multilingual video dubbing at scale をリリース ── 多言語吹き替えの自動化がここまで来た
ByLLM Watch編集部 2026年3月7日2026年3月10日

DescriptがOpenAIモデルを使い、意味とタイミングを最適化した多言語吹き替えを実現。

続きを読む OpenAI が How Descript enables multilingual video dubbing at scale をリリース ── 多言語吹き替えの自動化がここまで来た
Google DeepMind

Google DeepMind が Gemini can をリリース ── 文字や画像から手軽に音楽生成
ByLLM Watch編集部 2026年2月26日2026年3月10日

Google DeepMindがGeminiに音楽生成モデルLyria 3を統合。文字や画像から楽曲制作が可能に。

続きを読む Google DeepMind が Gemini can をリリース ── 文字や画像から手軽に音楽生成
Hugging Face

Hugging Face が PRX Part 3 — Training a Text-to-Image Model in 24h! をリリース
ByLLM Watch編集部 2026年3月4日2026年3月10日

Hugging FaceのPRX Part 3 — Training a Text-to-Image Model in 24h!リリース情報

続きを読む Hugging Face が PRX Part 3 — Training a Text-to-Image Model in 24h! をリリース
OpenAI

OpenAI が Codex-maxxing for long-running work を紹介 ── 単一プロンプトを超えて複雑なプロジェクトを攻略するテクニック
ByLLM Watch編集部 2026年6月23日

Jason Liu氏によるCodex活用事例。単一プロンプトを超えて複雑なプロジェクトを継続し、コンテキストを保持するテクニックを紹介。

続きを読む OpenAI が Codex-maxxing for long-running work を紹介 ── 単一プロンプトを超えて複雑なプロジェクトを攻略するテクニック
Hugging Face

Hugging Face が AI Agent 用語集を公開 ── Harness と Scaffold の違い、ちゃんと説明してみた
ByLLM Watch編集部 2026年5月26日

AIエージェント用語の混乱を解消。HarnessとScaffoldの違いをICLR 2026後の議論を基に整理したHugging Faceの用語集。

続きを読む Hugging Face が AI Agent 用語集を公開 ── Harness と Scaffold の違い、ちゃんと説明してみた

コメントを残すコメントをキャンセル