【朗報】Google Gemini、ついに「作曲家」デビュー！音のない世界に新しい恋のメロディを運ぶ「リリア3」の音楽生成がエモすぎて既存のDTM界隈が震えてる件

toko

2か月前

Geminiが音楽を奏でる時代へ

Googleの生成AI「Gemini」に、ついに待望の新機能が追加されました。それは「音楽生成」です。テキストを入力するだけで、あるいは画像をアップロードするだけで、その場の雰囲気にぴったりのメロディをAIが紡ぎ出します。音のない世界に、新しい恋のメロディを運ぶようなこの進化は、私たちのクリエイティビティをどう変えていくのでしょうか。今回は最新の音楽生成モデル「リリア3（Lyria 3）」の実力を徹底検証します。

リリア3（Lyria 3）とは何か？

今回Geminiに組み込まれた「リリア3」は、Google DeepMindが開発した最新の音楽生成AIです。これまでテスト版として一部で公開されていた機能が、ついにウェブ版のGeminiに正式実装されました。最大の特徴は、単なるBGM作成にとどまらず、歌声を含む楽曲制作や、既存のファイルに基づいたアレンジが可能な点にあります。無料版のユーザーでも利用できるため、誰でも手軽に「作曲家」としての第一歩を踏み出すことができるようになりました。

テキストから音楽、さらには画像からメロディへ

リリア3の使い方は非常に直感的です。Geminiのツールメニューから「音楽を作成」を選択し、作りたい音楽のイメージを言葉で伝えるだけ。「壮大なオープニングをイメージする、太鼓やドラムがメインの音楽」といった具体的な指示を出すと、AIがそのプロンプトをさらに洗練させ、数分足らずでハイクオリティな30秒の音源を生成します。また、バーベキューの画像などをアップロードして「この雰囲気に合う明るい曲」と指示すれば、画像の内容を解析して最適な音楽を作り出すことも可能です。視覚情報から聴覚情報への変換という、AIならではの新しい体験を提供してくれます。

歌詞も歌い上げる！J-POPからラップまで

驚くべきは、歌詞の読み上げ能力です。J-POP風のメロディから、韻を巧みに踏んだラップまで、入力したテキストを自然な歌声で表現します。検証では、特定のフレーズを指定しただけで、見事にその言葉をメロディに乗せて歌い上げることが確認されました。例えば「家の相談はジェミニ不動産」といったキャッチフレーズをリズムよく歌わせることも可能で、これは広告制作やSNSのショート動画用BGMとして、非常に現実的かつ強力な活用方法と言えるでしょう。

現状の限界と、これからの進化

もちろん、現時点ではいくつかの課題も残されています。生成される音源は1回につき30秒までとなっており、フルコーラスの楽曲を作るにはさらなるアップデートを待つ必要があります。また、生成された音楽に対して「テンポを速くして」「男性パートを強くして」といったチャット形式での詳細な編集（リミックス）は、まだ発展途上の段階です。AI自身も「編集は練習中」と回答することがあり、意図した通りの微調整には何度か試行錯誤が必要になる場面も見受けられました。しかし、これらは時間の問題で解決されるはずの課題であり、将来的にフル楽曲の制作や自由自在な編集が可能になる日は、そう遠くないでしょう。

クリエイターとしての新しい武器

リリア3によって生成された音楽には、AI製であることを示す「SynthID（シンスアイディ）」という電子透かしが埋め込まれています。これにより、著作権や権利関係の透明性を保ちつつ、クリエイターが安心して利用できる仕組みが整えられています。YouTubeのBGMに悩む動画投稿者や、自分の作品にちょっとした彩りを加えたいアーティストにとって、リリア3は「隣にいる作曲家」のような存在になるはずです。専門的なDTMの知識がなくても、あなたの言葉が世界に一つの歌になる。そんな魔法のような体験を、ぜひGeminiで体感してみてください。

ネットの反応

ついにGeminiでも音楽が作れるようになったんですね。Suno AIよりも音質が良く感じます。今後の進化が楽しみ！

歌詞の韻の踏み方が完璧すぎて驚きました。これ、自分が作曲家だったら真っ青になるレベルですね。AIの進化が止まらない。

環境音（アンビエント）の生成が意外とリアルで使えそう。ゲームやアニメのワンシーンの背景音として重宝しそうです。

30秒という制限はありますが、ショート動画用なら十分すぎるクオリティ。いずれ3分や4分のフル楽曲も作れるようになってほしい！

AIの所感

リリア3の登場は、音楽制作の民主化をさらに一歩進める出来事です。特に注目すべきは「画像からの生成」や「会話を通じた音楽の調整」という、マルチモーダルなアプローチです。単に音を作るだけでなく、文脈を理解して音に変換する能力は、Googleの強力な検索技術や言語モデルがあってこそ。既存の音楽生成サービスと比較しても、Geminiのエコシステム内で完結する利便性は圧倒的です。クリエイターがAIを敵対視するのではなく、共創パートナーとして使いこなす時代が、いよいよ本格的に到来したと言えるでしょう。