【SynthID】AIが生成した画像を識別できるAIをGoogle DeepMindが開発!一体どんな仕組み?徹底解説
WEELメディア事業部リサーチャーのいつきです。
今回みなさんにお伝えするのは、Google傘下のDeepMindが2023年8月29日に発表したAIツールの「SynthID」についてです。
なんと、このAIツールは、AIが生成したコンテンツを識別できる機能が搭載されているとのこと。
世の中には、AIが生成したコンテンツが大量に公開されているので、情報の信頼性を担保したり、調査したりする際に使えそうですね!
そこで今回は、SynthIDの機能やできることについて紹介します。
最後まで目を通すことで、AI生成コンテンツを識別するための仕組みが理解できるため、大量のコンテンツから正確な情報を見極めるための力が身につくことでしょう。
ぜひ最後までご覧ください。
SynthIDの概要
SynthIDは、Google DeepMindが開発し、Google Researchと提携して改良したAIツールです。このツールは、AIが生成した画像や音声などのコンテンツに電子透かしを埋め込む機能が備わっており、そのコンテンツがAIによって生成されたことを証明するのに役立ちます。
さらに、電子透かしが人間の視覚や聴覚に影響を与えることはないので、コンテンツの視聴体験を損なうこともありません。AIによって生成されたコンテンツを見極められるようになると、責任の所在が明確になるほか、情報の信頼性を高める効果が期待できます。
なお、生成AIを開発するリスクについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→生成AIの企業利用・開発のリスクとその対策を解説!開発失敗事例も紹介
SynthIDに実装された2つの深層学習モデル
SynthIDには、以下2種類の深層学習モデルが実装されています。
- 透かし入れ用モデル
- 識別用モデル
これら2つのモデルが生成AIコンテンツを見極めるための鍵を握っているといえるでしょう。
それぞれのモデルの詳細は、以下で解説していきますね!
透かし入れ用モデル
透かし入れ用モデルは、AIが生成した画像や音楽に電子透かしを埋め込む機能を搭載しています。元のコンテンツに合わせて電子透かしを入れるように調整されているので、人間の視覚や聴覚に知覚されにくい仕組みです。
確かに、電子透かしを入れることによってコンテンツの品質が低下することになれば、好んで使う方はほとんど現れないでしょう。より多くの方に利用してもらえるように配慮されているのが伝わってきますね。
識別用モデル
識別用モデルは、その名のとおり、AIが生成したコンテンツであることを見極められるモデルです。画像や音楽をスキャンすることで、SynthIDが埋め込まれていることを確認し、コンテンツ全体もしくは一部がAIによって生成されたことをユーザーが見極められるようにしてくれます。
また、コンテンツの形式が圧縮などによって一部変更されたとしても、識別用モデルはSynthIDの存在を見逃しません。よって、AIが少しでもコンテンツの生成に関わっていれば、見極められるということです。
SynthIDにできること
SynthIDにできるのは、AI生成画像と音楽の識別です。AIツールにさまざまな工夫を施すことによって、AI生成コンテンツを見極められる仕組みを整えています。
以下で、それぞれのコンテンツを識別できる仕組みを解説していくので、ぜひ参考にしてみてください。
AI生成画像の識別
画像を識別する際にSynthIDが最初に行うのは、画像のピクセル単位に電子透かしを直接追加する作業です。ピクセルという非常に細かい部分に電子透かしを埋め込むことで、人間の視覚で感知できないようにしています。
なお、透かしを埋め込むと聞くと、画像の画質が損なわれるイメージを持つかもしれませんが、SynthIDによって画質が低下する心配はありません。そもそも、画質が低下してしまっては、誰も利用しないはずなので当然といえば当然ですね。
その後、実際に画像を識別する際は、画像のスキャンを行い、結果を分析して識別するための3つの信頼レベルをユーザーに提供するとのこと。フィルターの追加・色の変更・さまざまな非可逆圧縮スキーム での保存など、さまざまな編集を加えても透かしを検出できるので安心です。
AI生成音楽の識別
AI生成音楽の識別では、SynthIDのウォーターマークをAIが生成した音楽コンテンツの波形に直接埋め込むところから始まります。
その後、音声の波形をスペクトルに変換。スペクトルは、音の周波数成分が時間の経過とともにどのように変化するかを表したものです。つまり、音がどのような音色で、どのようなリズムで変化しているかを示しています。
次に、このスペクトルに電子透かしを追加。この電子透かしは、音声の著作権保護や、音声の特定などに利用されます。
最後に、スペクトルを元の波形に戻せば、AI生成音楽の識別は完了です。一連の動作を行うなかで、SynthIDはオーディオのプロパティを活用して、電子透かしが人間の耳に聞こえないようにしているため、音楽の視聴体験が損なわれることはありません。
なお、生成AIの法人利用方法ついて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→生成AIの法人利用方法10選!法人向け生成AIツールや実際の事例も解説
SynthIDの今後の展望
SynthIDは、画像識別・音楽識別の両方の機能について、ごく限られた一部のユーザーにのみ提供しています。
画像識別は、Googleの機械学習ツール「Vertex AI」でImagenを利用している一部のユーザーに、音声識別は音声生成AIの「Lyria」 を通して、一部のアーティストなどにベータ版をリリースしているのが現状です。
しかし、今後はほかのモデルでも幅広くSynthIDを利用できるように拡張していくとのこと。さらに、多くの製品にSynthIDを統合することで、人々や組織がAIで生成されたコンテンツを責任を持って操作できるような未来を描いています。
なお、音声生成AIのLyriaついて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Lyria】GoogleのDeepMindとYouTubeが開発した、Youtubeショート専用の音楽生成AI(公開されたら埋め込むのがよろしいかと)
筆者のコメント
近年AIが急速に発達してきたことによって、著作権の侵害や虚偽情報の発信など、これまでにさまざまな問題が起きていました。しかし、今回ご紹介したSynthIDを使用すれば、生成AIコンテンツを見極められるので、これらの問題を解決する第一歩が踏み出せたと感じています。
現状はベータ版が一部のユーザーに公開されている状態ですが、今後改良を重ねることで、いずれは本格的に一般ユーザーにリリースされる日が来るでしょう。
近い未来に備え、今からでもSynthIDをはじめとした、生成AIコンテンツを見極めるためのツールに関心を向けておくことをおすすめします。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、サービス紹介資料もご用意しておりますので、併せてご確認ください。