Google DeepMind が Gemini can をリリース ── 文字や画像から手軽に音楽生成

Gemini can カバー画像
GOOGLE DEEPMIND

最終更新: 2026年02月26日 23:49 元記事 →

文字や画像を投げるだけでそこそこの品質の音楽が作れるなんて、流石はGoogleというべきか。これだけ手軽になると、誰もが気軽にBGMを作る日常がすぐそこまで来ている気がする。

── レン

何が変わったのか

Geminiアプリ内に、同社最強クラスの音楽生成モデル「Lyria 3」が搭載されました。テキストでの指示はもちろん、画像からその雰囲気に合わせた楽曲を生成できるのが新機能。出力される音源は30秒のトラックで、専門知識がなくてもスマホ一つで作曲が可能に。

技術背景と意義

「Lyria 3」は、楽器の種類や曲の雰囲気といった複雑な指示を高精度に理解できるモデルです。これまでの音楽生成AIよりも人間の意図に近い表現ができるよう進化しており、AIが単なるオマズレから実用的な創作ツールになりつつある証拠。言葉や視覚情報を、複雑な音響データへ変換する技術の結晶だ。

Redditの反応

Google DeepMindの音楽生成AI「Lyria 3」と、その公式プラットフォームである「ProducerAI」の登場に、Reddit界隈がざわついている。現行のライバルであるSunoと比較して「ノイズが少なく、歪んだギターのような楽器も高品位」という評価が多く、音質面ではかなりやばい進化を遂げているようだ。

実際に試したユーザーからは、具体的な称賛の声が上がっている。

「Sunoよりもわずかに進んでいるよ。ノイズが少なく、高忠実度だ」というコメントにある通り、楽器の表現力には驚きの声が多い。一方で、「ボーカルが足を引っ張っている」という意見もあり、人間の歌声の再現だけはまだ壁があるようだ。

ツールとしての面白い使い道を模索する投稿も目を引いた。

「皿洗いしろと言うのはNo ❌、その為の曲を作るのはYes ✅」というジョーク交じりの投稿が象徴するように、日常的な命令を楽曲にする遊び心が溢れている。ただし、「4〜5曲作るとどこか反復感がある」と冷静に指摘する声もあり、AI特有の癖にはまだ課題が残るのかもしれない。

著作権問題に対する懸念も、もちろん投げかけられている。

「ビッグミュージックがビッグGoogleを訴える争いが見たい」という皮肉めいたコメントが寄せられる通り、技術の進歩に対する法整備の遅れを心配する空気感もある。正直言うと、これからの覇権争いがどう展開するのか、目が離せない。

入手方法・リンク

GitHub等での公開はなく、クローズドな環境としてGeminiアプリから利用できます。現在はアプリ上で試せる形がメインで、特別なAPIキーなどを用意する必要はないはず。

SOURCE: Google DeepMind (2026-02-18)

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です