【Lyria 3・Lyria 3 Pro】テキスト・画像・動画入力に対応したGoogleの音楽生成AIを徹底解説!

- Lyria 3とLyria 3 ProはGoogle DeepMind発のAI音楽生成モデル
- Geminiアプリに統合され、テキストや画像をもとに、ボーカル・歌詞・インストゥルメンタルを含む30秒の高品質な楽曲をわずか数秒で生成
- 会話の流れの中で楽曲を作り、その場でカバーアートまで生成できる
2026年2月19日、Google DeepMindが手がけるAI音楽生成モデル「Lyria 3」が公開されました!
音楽制作の経験がまったくない方でも、チャット画面にプロンプトを入力するだけで、オリジナル楽曲が完成してしまう、まさにAI音楽生成の新たなマイルストーンとなるサービスです。従来のAI作曲ツールとは異なり、Geminiの中に音楽生成が自然に組み込まれているため、会話の流れの中で楽曲を作り、その場でカバーアートまで生成できる点が大きな特徴です。
そこで本記事では、Lyria 3とLyria 3 Proの技術的な仕組みから使い方、料金プラン、ライセンス情報まで、徹底的に解説していきます。ぜひ最後までご覧ください!
\生成AIを活用して業務プロセスを自動化/
Lyria 3とは?

Lyria 3は、Google DeepMindが開発した音楽生成AIモデルです。
Geminiアプリのチャットインターフェースから直接利用できるので、テキストプロンプトによる指示だけで、メロディ、ハーモニー、リズム、ボーカル、歌詞を含んだ楽曲を自動生成することができます。
対応する入力はテキストだけでなく、写真や動画をアップロードすると、そのビジュアルの雰囲気に合ったBGMを生成してくれるマルチモーダル対応が大きな魅力です。
生成される楽曲は最大30秒で、出力フォーマットはMP4(動画)とMP3(音声)に対応しています。

ジャンルはポップ、ロック、エレクトロニック、ジャズ、オーケストラ、アンビエント、映画音楽など幅広くカバーしていて、80年代シンセポップやラテンポップ、90年代ヒップホップといった時代やスタイルの指定も可能です。
対応言語は英語、ドイツ語、スペイン語、フランス語、ヒンディー語、日本語、韓国語、ポルトガル語の8言語で、日本語でのプロンプト入力や歌詞生成にも対応しています。なお、利用には18歳以上であることが条件となっています。
Lyria 3の仕組み
Lyria 3は、音声生成に特化したLatent Diffusion(潜在拡散)アーキテクチャを採用しています。

画像生成AIのStable Diffusionと同様に、ノイズからデータを段階的に復元するプロセスを音声に応用した設計です。具体的な処理の流れとしては、まずユーザーが入力したテキストプロンプトが、Transformerベースの言語エンコーダーでセマンティックベクトル(意味表現)に変換されます。
このベクトルが、拡散ベースの音声デコーダーに渡され、メロディ・ハーモニー・リズム・ボーカルといった音楽要素を段階的に生成していきます。
画像や動画が入力された場合は、視覚的な内容の解析・シーン検出が行われ、それに応じた音楽要素が同期的に生成されます。
Lyria 3 Proとは

Lyria 3 Proは、Google DeepMindが展開する音楽生成モデル「Lyria 3」の上位版です。2026年3月に発表され、最大3分のトラック生成と、より細かなカスタマイズに対応しました。
特に注目したいのは、楽曲の構成を踏まえて生成できる点でしょう。従来の短尺生成では、雰囲気の近い音を素早く試せる一方で、曲全体の展開まで一貫して設計するのは簡単ではありませんでした。
そこでLyria 3 Proでは、イントロ、バース、コーラス、ブリッジといった要素を指定しながら、より長い楽曲を作れるようになりました。
また、利用先も広がっており、Vertex AI、Google AI Studio、Gemini API、Google Vids、Gemini app、ProducerAIなどで展開されています。
Lyria 3との違い
| 項目 | Lyria 3 | Lyria 3 Pro |
|---|---|---|
| 位置づけ | カスタム音楽生成モデル | より高度な音楽生成モデル |
| 主な役割 | 創作表現を後押しする音楽生成 | 長尺かつ構造を意識した音楽生成 |
| 生成長 | 詳細は公開されていません | 最大3分 |
| 指示の粒度 | 詳細は公開されていません | イントロ、バース、コーラス、ブリッジなどを指定可能 |
| コントロール性 | 基本的な音楽生成 | カスタマイズと creative control を強化 |
| 向いている使い方 | アイデア出しや短い生成の活用が中心と見られます | 構成を持つ楽曲制作や長尺トラック制作に適しています |
Lyria 3 ProとLyria 3の違いは、生成できる楽曲の長さと、構成レベルでの指示のしやすさです。
Lyria 3とどっちを使うべき?
| 利用シーン | 推奨モデル | 理由 |
|---|---|---|
| アイデア出し・試作 | Lyria 3 | 短い生成で発想を広げやすい |
| BGMのプロトタイプ作成 | Lyria 3 | 軽量に複数パターンを試せる |
| 完成度の高い楽曲制作 | Lyria 3 Pro | 最大3分の長尺生成が可能 |
| 構成を持つ音楽制作 | Lyria 3 Pro | セクション単位での指示ができる |
| 商用コンテンツ制作 | Lyria 3 Pro | 制御性と統合性が高い |
Lyria 3とLyria 3 Proのどちらを選ぶべきかは、用途と求める制作レベルによって変わります。両者は同じ音楽生成モデルの系統に属しながらも、役割が明確に分かれています。
Lyria 3の特徴

Lyria 3の1番の特徴は、Geminiの会話インターフェースとシームレスに統合されている点です。専用の音楽生成ツールを別途起動する必要がなく、チャットの中で「こういう曲を作って」と指示するだけで楽曲が生成されます。
生成後に「もう少しテンポを速くして」「ボーカルを女性に変えて」といった追加指示を対話形式で行うことができるので、音楽プロデューサーと会話するような体験が得られます。
前世代のLyria 2と比較すると、楽曲の複雑さとリアリティが大幅に向上しています。
特に、自動歌詞生成の能力が新たに加わり、ユーザーが歌詞を考える必要なくプロンプトの雰囲気に合った歌詞を自動で作詞し、メロディに乗せて歌ってくれます。ジャンルごとの完成度としては、エレクトロニック、ポップ、オーケストラといった西洋音楽のジャンルが特に高い忠実度を示しています。
もう1つの注目ポイントは、画像・動画からの楽曲生成です。
旅行先で撮った風景写真やペットの動画をアップロードすれば、その雰囲気に合ったサウンドトラックを作成してくれます。
なお、初代モデル「Lyria」について詳しく知りたい方は、以下の記事も参考にしてみてください。

Lyria 3 Proでパワーアップしたポイント
Lyria 3 Proには、音楽生成の実用性を高める複数の特徴があります。特に注目すべきは「長尺生成」「構造制御」「実務適用」の3点です。
長尺かつ構造的な音楽生成
Lyria 3 Proは最大3分の楽曲生成に対応しています。これにより、短いループや断片的な音源にとどまらない制作が可能になりました。
従来の音楽生成では、数十秒程度のクリップをつなぎ合わせる必要がありました。しかしLyria 3 Proでは、1回の生成で楽曲として成立する構造を持たせられます。
楽曲パーツ単位での指示が可能
Lyria 3 Proでは、楽曲の構成要素ごとに指示を出せます。イントロ、バース、コーラス、ブリッジなどを個別に設計できるようになりました。
この仕組みにより、展開の意図を反映した生成が行えます。例えば「静かなイントロから盛り上がるコーラスへ」といった流れも設計可能です。
クリエイター・ビジネス用途への最適化
Lyria 3 Proは複数のGoogleプロダクトで利用可能です。Vertex AIやGemini APIなど、開発環境への統合も進んでいます。
これにより、動画制作やアプリ開発などへの組み込みが容易になりました。例えばGoogle VidsやGemini appと連携することで、コンテンツ制作の一部として活用できます。
Lyria 3の使い方
Lyria 3はGeminiアプリから直接利用することができます。特別なセットアップは不要で、Googleアカウントがあればすぐに始められます。
Geminiアプリでテキストから楽曲を生成する
音楽生成ツールを選択する

チャット画面のプロンプト入力欄の付近にある「ツール」メニューから「音楽を作成」を選択します。もしくは、チャットに直接「曲を作って」と入力するだけでも音楽生成モードに切り替わります。
プロンプトを入力する
生成したい楽曲のイメージをテキストで入力します。より良い結果を得るために、以下の要素を含めるのがおすすめです。
- ジャンルと時代(例:「80年代シンセポップ」「90年代ヒップホップ」)
- テンポとリズム(例:「アップビートで踊れる」「スローバラード」)
- 楽器の指定(例:「アコースティックギター中心」「ピアノとストリングス」)
- ボーカルの属性(例:「女性ボーカル」「男性のハスキーな声」)
- 歌詞のテーマ(例:「夏の海辺の恋」「都会の夜景」)
プロンプト例
80年代風のシンセポップで、女性ボーカル、
夏の夕暮れをテーマにした爽やかな楽曲を作ってください楽曲を確認・調整する
数秒で楽曲が生成されます。気に入らない部分があれば、同じチャット内で「テンポをもう少し速くして」「ボーカルを男性に変えて」などと指示して調整できます。
ダウンロードまたは共有する
生成された楽曲はMP4またはMP3形式でダウンロードできます。共有用の固定URLも発行されるため、SNSなどで共有することも可能です。
画像・動画から楽曲を生成する
Geminiのチャット画面で写真や動画をアップロードし、「この画像の雰囲気に合う曲を作って」と指示します。
すると、Lyria 3がビジュアルの内容やムードを分析し、それにマッチした歌詞付きトラックを自動生成します。旅行写真やペットの動画、イベントの思い出の写真など、あらゆるビジュアルを音楽に変換できます。
Vertex AI APIで利用する(開発者向け)
開発者やエンタープライズ用途では、Vertex AI経由でLyriaモデルをAPI利用することも可能です。
2026年2月20日時点でVertex AIで提供されているモデルIDは従来モデル lyria-002(Lyria 2)で、REST APIから呼び出す形式です。
POST /v1/projects/{PROJECT_ID}/locations/{LOCATION}/publishers/google/models/lyria-002:predictリクエストパラメータとして、prompt(楽曲の説明)、negative_prompt(除外したい要素)、seed(再現性のためのシード値)、sample_count(生成するクリップ数)などが指定できます。出力は48kHz WAV形式で、1クリップあたり約32.8秒の楽曲が生成されます。
【業界別】Lirya 3の活用シーン
Lirya 3には様々な活用方法があります。ここでは、いくつかの業界別にLirya 3の活用シーンを紹介します。
映像・動画制作業界
YouTubeショートやTikTok向けのBGMを著作権フリーで即座に生成できるため、動画クリエイターにとっては非常に実用的です。
撮影した映像をそのままGeminiにアップロードし、映像の雰囲気に合った音楽を数秒で用意できるため、BGM選定にかけていた時間を大幅に削減できます。
なお、エンタメ業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。
広告・マーケティング業界
広告用のジングルやプロモーション動画のBGMを、コンセプトに合わせてスピーディに生成できます。複数パターンを短時間で試作できるため、クライアントへの提案の幅が広がります。
なお、広告業界における生成AI導入事例について、詳しく知りたい方は以下の記事も参考にしてみてください。

ゲーム・アプリ開発業界
プロトタイプ段階でのBGM仮当てに活用できます。本格的な楽曲制作を作曲家に依頼する前に、Lyria 3でイメージに近い雰囲気のサンプルを生成し、方向性をチーム内で共有するといった使い方が効果的です。
なお、ゲーム業界における生成AIの活用については下記の記事を参考にしてください。

教育・研究分野
音楽理論の教材として、特定のジャンルやスタイルの楽曲を即座に生成して比較するといった使い方ができます。AI生成音楽の品質評価や、SynthID透かし技術の検証といった研究用途にも適しています。
なお、生成AIによる教育業界の業務効率かについて、詳しく知りたい方は以下の記事も参考にしてみてください。

個人クリエイター・SNSユーザー
音楽制作の知識がなくても、自分だけのオリジナル楽曲を作ってSNSで共有できます。誕生日の動画やイベントの思い出映像にパーソナライズされたBGMを添えるなど、日常的な表現の幅が広がります。
なお、クリエイティブ作成における生成AIの活用方法は下記の記事を参考にしてください。

【課題別】Lyria 3が解決できること
Lyria 3の登場でいくつかの課題も解決できるようになりました。ここでは、Lyria 3が解決できる課題の一部をいくつか紹介します。
BGM探しの時間が短縮
フリー音源サイトでイメージに合うBGMを延々と探し続ける、という作業から解放されると思います。テキストで欲しい雰囲気を伝えるだけで、コンセプトにぴったりのオリジナル楽曲がすぐに手に入ります。
著作権の心配をせずにBGMを使える
フリー素材であっても利用規約の確認が必要なケースは多いですが、Lyria 3で生成した楽曲はユーザー自身が所有権を持つため、著作権侵害のリスクを気にせずに利用することができます。
音楽制作のスキルなしでもオリジナル楽曲を用意できる
作曲や編曲の知識がなくても、自然言語で指示するだけでプロ品質に近い楽曲が生成されます。音楽制作の民主化という観点で、大きなインパクトを持つツールです。
なお、音楽生成AIツールのおすすめ11選について、詳しく知りたい方は以下の記事も参考にしてみてください。

Lyria 3を使ってみた
実際にGeminiアプリからLyria 3を試してみましょう。今回は3つのパターンで検証を行い、生成楽曲のクオリティと実用性を確認していきます。
検証1:テキストプロンプトでJ-POP風楽曲を生成
切ない冬の恋をテーマにした、女性ボーカルのJ-POPバラードを作ってください。
ピアノとストリングスを中心にして、テンポはゆっくりめでお願いします。20秒ほどで楽曲が生成されました。ピアノのイントロからストリングスが入ってくる構成は指示通りになっています。自動生成された日本語歌詞も文法的には自然ですね。
検証2:写真からの楽曲生成
次に、Nano Banana Proで生成した夕焼けのワイキキビーチの風景写真をアップロードし、「この写真の雰囲気に合う曲を作って」と入力しました。

生成された楽曲はチルアウト系のトラックで、写真の穏やかな雰囲気とよくマッチしていると思います。テキストで音楽のイメージを言語化するのが苦手な方にとって、画像入力は非常に便利な入力方法だと感じます。
全体として、無料で手軽に使えるAI音楽生成ツールとしては十分なクオリティだと感じました。
SunoやUdioといった専門特化型のサービスと比較するとまだ差はありますが、Geminiの会話フローの中で楽曲を生成し、そのまま同じチャット内でカバーアートの生成やプロンプトの微調整ができるのは非常に便利だと思います。
アップデートされたLyria 3 Proも使ってみた!
GeminiからはGoogle AI Plus、Pro、Ultra プランで利用が可能ですが、Google AI Studioでは有料支払い設定済みのAPIキーを使うことで、楽曲を生成することができます。
Google AI Studioで右側のサイドメニューからLyria 3 Proを選択し、支払いに使用するAPIキーを設定すればOKです。

今回は下記のプロンプトを入力しました。
Genre: corporate electronic
Mood: positive, clean, professional
Tempo: 110 BPM
Structure:
- Intro: light synth arpeggio, clean tone
- Verse: add rhythmic bass and soft beat
- Chorus: brighter synths, energetic but not overwhelming
- Bridge: minimal break with percussive elements
- Outro: loop-friendly ending
Additional instructions:
- avoid overly dramatic changes
- keep consistent energy for background use
- suitable for voice-over実際に生成している様子が下記です。
生成された楽曲がこちら。
非常に簡単に、かつ30秒以上の楽曲を生成することができました。ちなみに1曲生成にかかった費用は53円程度です。

Lyria 3の安全性・制約
Lyria 3では、Google DeepMindが開発した電子透かし技術「SynthID」がすべての生成楽曲に埋め込まれます。
この透かしは、人間の耳には聞こえませんが、圧縮や編集を行った後でもソフトウェアによって検出可能で、AI生成コンテンツであることを事後的に確認できるようになっています。
また、コンテンツフィルタリングも実装されていて、有害な歌詞や不適切な内容の生成を抑制する仕組みが備わっています。
Lyria 3の料金
Lyria 3はGeminiアプリの無料ユーザーでも利用できますが、上位プランのサブスクライバーほど多くの楽曲を生成できる仕組みになっています。
具体的な生成回数の上限は公開されていませんが、無料プランでも基本的な楽曲生成は体験できるため、まずは試してみたいという方にとってもハードルは低いと思います。
| プラン | 月額料金 |
|---|---|
| 無料 | – |
| Google AI Plus | 20ドル |
| Google AI Pro | 19.99ドル |
| Google AI Ultra | 249.99ドル |
Lyria 3のライセンス
Lyria 3で生成された楽曲の権利関係は、Googleの生成AI利用規約に準拠しています。基本的に、生成されたコンテンツの所有権はユーザーに帰属し、Google側が著作権を主張することはありません。
| 利用用途 | 可否 | 備考 |
|---|---|---|
| 商用利用 | ⭕️ | |
| 改変 | 🔺 | YouTubeショート等のBGMとして動画に組み込む利用は想定されています。ただし楽曲単体の販売は推奨されていません。 |
| 配布 | ⭕️ | |
| 特許使用 | 🔺 | Google利用規約およびジェネレーティブAI禁止事項ポリシーに従う必要があります。 |
| 私的使用 | ⭕️ |
よくある質問
Lyria 3・Lyria 3 Proで音楽生成が次のステージへ!
Lyria 3は、Google DeepMindが開発したLatent Diffusionベースの音楽生成AIモデルで、Geminiアプリに統合される形でリリースされました。
テキスト・画像・動画からボーカル・歌詞付きの30秒楽曲を生成でき、無料ユーザーでも利用可能です。
気になった方は、ぜひ一度試してみてください。
最後に
いかがだったでしょうか?
弊社では、AI導入を検討中の企業向けに、業務効率化や新しい価値創出を支援する情報提供・導入支援を行っています。最新のAIを活用し、効率的な業務改善や高度な分析が可能です。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

