【Google Magenta realtime】演奏と生成が融合!Google発リアルタイム音楽AIを徹底解説

押さえておきたいポイント
  • 演奏と同時に音楽を生成できるGoogle発の生成AIで、ライブ演奏など即興性が求められる場面に最適
  • 約19万時間の楽曲データをもとに高音質なステレオ音声をリアルタイム出力できる
  • Apache 2.0/CC BY 4.0で商用利用が可能だが、Colabでの動作は安定しておらず今後の改善に期待

2025年6月20日、Googleから新たなAIモデルがリリースされました!

今回発表されたのは「Magenta realtime」。

Google DeepMindによって開発されたリアルタイム音楽生成のためのオープンウェイトモデルです。このモデルは従来の音楽生成モデルと異なり、「演奏しながら生成する」という特徴があります。

本記事では、Magenta realtimeの概要から特徴、使い方について解説をします。ぜひ最後までお読みください!

目次

Magenta realtimeの概要

Google DeepMindによって開発されたリアルタイム音楽生成のためのオープンウェイトモデル。従来の音楽生成モデルと異なり、「演奏しながら生成する」という特徴を持ち、ライブパフォーマンスに適した設計になっています。

技術的な詳細はまだPaperが公開されていません。(※2025年6月24日時点)

現時点で公開されている技術の概要として、モデルは約8億のパラメータを持つオートレグレッシブTransformerベースで、連続生成のために、10秒間の過去の音声トークン(context)とスタイル埋め込みを使って、2秒間の新しい音声を逐次生成します。

参考:https://magenta.withgoogle.com/magenta-realtime

さらに、チャンク間のつなぎ目はクロスフェード処理を用いて自然になるように作られています。

Colabの無料版TPU(v2-8 TPU)では、この2秒間のオーディオは1.25秒で生成され、リアルタイム係数は1.6になります。

Magenta realtimeで生成される音

Magenta realtimeで生成される音はステレオ48kHzのHi-Fi音質であり、モデルはpectroStreamコーデックを通じて、48kHz・ステレオの音声をトークン化・復元する設計になっています。これはSoundStreamの後継であり、従来よりも格段に自然な音質が得られる構造です。

また、訓練データは約19万時間の主にインストゥルメンタル音楽(非ボーカル)で構成されており、多様なジャンルの実際の演奏音が含まれており、その結果ピアノやギター、ドラム、ベース、シンセサイザーなどの多楽器アンサンブルを模した出力が可能。

音楽のジャンルはトレーニングデータの関係上、西洋的ポピュラー音楽(ロック、ポップ、ジャズ、クラシックなど)に強く、民族音楽やボーカル中心ジャンルは不得意

また、モデルが記憶できるのは10秒間のみであり、2秒単位の音を生成します。そのため、短いリフやループ、フレーズ単位の音楽には強い一方で、Aメロ→Bメロ→サビのような長時間の楽曲生成には不向き。

さらに、歌詞付きの歌声は非対応であり、非言語的なハミングやスキャットとして生成されますが、意味を持った言葉は生成されません。

Magenta realtimeのライセンス

Magenta realtimeのライセンスはApacheライセンス2.0です。そのため、商用利用は可能、再配布や改変なども可能ですが、著作権表示とライセンス表記の保持義務はあります。

利用用途可否
商用利用⭕️
改変⭕️
配布⭕️
特許使用⭕️
私的使用⭕️
参考:https://www.anthropic.com/legal/commercial-terms

また、Google Cloud StorageやHugging Faceで提供されているモデルの重みファイルについては、CC BY 4.0のため、出典の表示が必須であるのと、改変して利用する場合には明記が必要です。

さらに、Googleは上記ライセンスの他に下記の使用上の注意と制限を明示しています。

【許可事項】

  • 人間との共創支援(human-AI interaction)
  • 音楽教育、即興演奏、ライブ創作
  • ゲームやアートインスタレーション

【禁止事項】

  • 著作権侵害にあたる出力の生成
  • 文化的に不適切な内容(暴力、差別など)の生成
  • アウトプットの責任逃れ:「出力物の使用における責任はユーザーにある」と明示。

ここまでのMagenta realtimeライセンスについてまとめると以下のようになります。

スクロールできます
項目ライセンス商用利用改変・再配布クレジット表示注意事項
ソースコードApache 2.0必須特許使用許諾含む
モデル重みCC BY 4.0必須出力物の責任はユーザーに帰属
使用条件Google独自の追加規定条件付き条件付き利用目的に準拠著作権侵害や不適切出力は禁止

なお、Google発の高速・低コスト・高精度なマルチモーダル対応の軽量LLMについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

Magenta realtimeの使い方

では実際にMagenta realtimeをGoogle Colaboratoryで使っていきましょう。

Google Colaboratoryのコード自体は用意されているので、こちらを使っていきます。また、GitHubにも上がっています。

参考:https://colab.research.google.com/github/magenta/magenta-realtime/blob/main/notebooks/Magenta_RT_Demo.ipynb#scrollTo=9HcmLuWtE213

使ってみたところ、エラーが出てしまったので、別のNotebookでコーディングしたりVast.aiでGPUを借りて1からコーディングしてみましたが、やはり実装は不可能でした。

参考:https://github.com/magenta/magenta-realtime/issues/4

GitHubのIssueにもGoogle Colaboratoryのファイルが壊れているという内容が上がっていましたが、バージョンを合わせて実行してもやはりダメでした。

まとめ

本記事ではMagenta realtimeの概要や使い方について解説しました。公式でGoogle Colaboratoryのデモが用意されていましたが、GitHubのIssueが立っているように、Google Colaboratoryでは実行することができませんでした。

私は数時間格闘しましたが、やはり実行することはできず、今後のアップデートを待つことになりそうです。

また、今後は以下のようなアプリケーションがデバイス上で動作するように開発を行う、技術レポートの公開、微調整のためのColab、リアルタイムオーディオ入力の調整のためのColabといった点を公開していくようです。

参考:https://magenta.withgoogle.com/magenta-realtime

まだまだMagenta realtimeから目は離せなさそうですね!

最後に

いかがだったでしょうか?

演奏と生成がシームレスにつながる新体験。即興性と表現力を兼ね備えた音楽AIで、創作現場を革新しませんか。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

まずは、無料相談にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
無料相談

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、サービス紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • 翔平

    総合病院で10年間理学療法士として勤務し、患者のリハビリテーション支援に従事。その後、Pythonを独学で学び、データ分析のスキルを活かしてデータアナリストに転身。 データ分析の知見を活かし、主にテクニカル記事を担当。趣味はキックボクシング。

  • URLをコピーしました!
  • URLをコピーしました!
目次