【SynthID】GoogleのAIコンテンツ識別技術!概要やできること、確認方法を徹底解説
WEELメディア事業部リサーチャーのいつきです。
今回みなさんにお伝えするのは、Google傘下のDeepMindが2023年8月29日に発表したAIツールの「SynthID」についてです。
なんと、このAIツールは、AIが生成したコンテンツを識別できる機能が搭載されているとのこと。世の中には、AIが生成したコンテンツが大量に公開されているので、情報の信頼性を担保したり、調査したりする際に使えそうですね!
そこで今回は、SynthIDの機能やできることについて紹介します。
最後まで目を通すことで、AI生成コンテンツを識別するための仕組みが理解できるため、大量のコンテンツから正確な情報を見極めるための力が身につくことでしょう。
ぜひ最後までご覧ください。
SynthIDの概要
SynthIDは、Google DeepMindが開発し、Google Researchと提携して改良したAIツールです。このツールは、AIが生成した画像や音声などのコンテンツに電子透かしを埋め込む機能が備わっており、そのコンテンツがAIによって生成されたことを証明するのに役立ちます。
さらに、電子透かしが人間の視覚や聴覚に影響を与えることはないので、コンテンツの視聴体験を損なうこともありません。AIによって生成されたコンテンツを見極められるようになると、責任の所在が明確になるほか、情報の信頼性を高める効果が期待できます。
なお、生成AIを開発するリスクについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
SynthIDに実装された2つの深層学習モデル
SynthIDには、以下2種類の深層学習モデルが実装されています。
- 透かし入れ用モデル
- 識別用モデル
これら2つのモデルが生成AIコンテンツを見極めるための鍵を握っているといえるでしょう。
それぞれのモデルの詳細は、以下で解説していきますね!
透かし入れ用モデル
透かし入れ用モデルは、AIが生成した画像や音楽に電子透かしを埋め込む機能を搭載しています。元のコンテンツに合わせて電子透かしを入れるように調整されているので、人間の視覚や聴覚に知覚されにくい仕組みです。
確かに、電子透かしを入れることによってコンテンツの品質が低下することになれば、好んで使う方はほとんど現れないでしょう。より多くの方に利用してもらえるように配慮されているのが伝わってきますね。
識別用モデル
識別用モデルは、その名のとおり、AIが生成したコンテンツであることを見極められるモデルです。画像や音楽をスキャンすることで、SynthIDが埋め込まれていることを確認し、コンテンツ全体もしくは一部がAIによって生成されたことをユーザーが見極められるようにしてくれます。
また、コンテンツの形式が圧縮などによって一部変更されたとしても、識別用モデルはSynthIDの存在を見逃しません。よって、AIが少しでもコンテンツの生成に関わっていれば、見極められるということです。
SynthIDにできること
SynthIDにできるのは、AI生成画像と音楽、テキストの識別です。AIツールにさまざまな工夫を施すことによって、AI生成コンテンツを見極められる仕組みを整えています。
以下で、それぞれのコンテンツを識別できる仕組みを解説していくので、ぜひ参考にしてみてください。
AI生成画像の識別
画像を識別する際にSynthIDが最初に行うのは、画像のピクセル単位に電子透かしを直接追加する作業です。ピクセルという非常に細かい部分に電子透かしを埋め込むことで、人間の視覚で感知できないようにしています。
なお、透かしを埋め込むと聞くと、画像の画質が損なわれるイメージを持つかもしれませんが、SynthIDによって画質が低下する心配はありません。そもそも、画質が低下してしまっては、誰も利用しないはずなので当然といえば当然ですね。
その後、実際に画像を識別する際は、画像のスキャンを行い、結果を分析して識別するための3つの信頼レベルをユーザーに提供するとのこと。フィルターの追加・色の変更・さまざまな非可逆圧縮スキーム での保存など、さまざまな編集を加えても透かしを検出できるので安心です。
AI生成音楽の識別
AI生成音楽の識別では、SynthIDのウォーターマークをAIが生成した音楽コンテンツの波形に直接埋め込むところから始まります。
その後、音声の波形をスペクトルに変換。スペクトルは、音の周波数成分が時間の経過とともにどのように変化するかを表したものです。つまり、音がどのような音色で、どのようなリズムで変化しているかを示しています。
次に、このスペクトルに電子透かしを追加。この電子透かしは、音声の著作権保護や、音声の特定などに利用されます。
最後に、スペクトルを元の波形に戻せば、AI生成音楽の識別は完了です。一連の動作を行うなかで、SynthIDはオーディオのプロパティを活用して、電子透かしが人間の耳に聞こえないようにしているため、音楽の視聴体験が損なわれることはありません。
新機能:AI生成テキストの識別
2024年10月24日、Google DeepMindはSynthIDテキスト透かしツールをオープンソース化しました。この新機能により、AIが生成したテキストを見分けることが可能になりました。
このツールは、文章を作る過程で単語の選択確率を少しだけ調整することで、人間には気づかれない透かしを埋め込みます。この微調整により、AIが生成した文章パターンに変化が起こり、AIが作った文章であることを示す「指紋」のような役割を果たすのです。
「私の好きな果物は〇〇です。」という例文で説明すると、AIが「りんご」「バナナ」「みかん」などの単語を選ぶ際、その確率を少しだけ変えるという仕組みです。この仕組みは、3文以上の文章から使え、長い文章になるほど精度が上がります。1つの文に10個以上、1ページに数百個もの調整が入ることもあります。
開発者や企業は、このツールを無料で使用できます。AIが作った文章かどうかを判断する助けになるでしょう。ただし、この技術だけでAI生成のコンテンツ問題を解決できるわけではありません。偽情報対策の一つとして期待されています。
Geminiアプリやその他ウェブサービスで生成されたテキストにも、この技術が使われ始めています。今後、さまざまな製品にSynthIDが組み込まれていくでしょう。
なお、生成AIの法人利用方法ついて詳しく知りたい方は、下記の記事を合わせてご確認ください。
SynthIDの確認方法
SynthIDを使ってAIが生成したコンテンツを確認する方法は、テキスト、画像、音楽で少しずつ違います。ここでは、それぞれの確認方法について説明します。
画像の確認方法
- SynthID対応のツールやプラットフォーム(例:Google Cloud の Vertex AI)にアクセス。
- 確認したい画像をアップロード。
- 画像スキャン機能を実行。
「電子透かしが検出された」「電子透かしが検出されなかった」「AIによって生成された画像の可能性がある」の3つのレベルで判定されます。
音楽の確認方法
- SynthID対応の音楽分析ツールを使用。
- 確認したい音楽ファイルをアップロード。
- 音声波形の分析を実行。
結果は、電子透かしの有無や、AIによる生成の可能性が示されます。
テキストの確認方法
テキストの確認は、以下3つの方法があります。
Hugging Face Transformersを使用する方法:
- Hugging Face Transformersのライブラリをインストール。
- SynthID Textの検出機能をインポート。
- 確認したいテキストに対して検出機能を実行。
GitHubのリポジトリを利用する方法:
- GoogleのGitHubリポジトリからSynthID Textの検出ツールをダウンロード。
- 提供されているスクリプトを使用し、テキストの検証。
Hugging Faceのウェブインターフェースを使用する方法:
- Hugging Faceの公開ページ(https://huggingface.co/spaces/google/synthid-text)にアクセス。
- 確認したいテキストを入力欄に貼り付け。
- 「Run」ボタンをクリックして結果を確認。
「AIが生成した可能性が高い」「人間が書いた可能性が高い」「判断できない」の3パターンで結果が表示されます。
注意点として、SynthIDの判定は100%正確というわけではありません。短い文章や大幅に編集されたコンテンツでは、正確な判定が難しい場合があります。
現時点では一般ユーザーが簡単に利用できるツールは限られているため、今後の開発と公開が期待されています。
GitHubで入手可能なSynthID
GoogleがSynthIDのソースコードをGitHubで公開したことで、世界中の開発者がこのAI識別技術を自由に利用し、改良できるようになりました。
GitHubで公開されているのは、テキストに透かしを入れる部分と、その透かしを検出する部分の2つのコードです。開発者は、このコードを自分のプロジェクトに組み込んで使用できます。
オープンソース化されたことで、SynthIDの応用範囲が大きく広がり、ニュースサイトやSNSでの偽情報対策など、さまざまな場面での活用が考えられます。
ただし、このコードを使いこなすには、ある程度のプログラミング知識が必要です。一般のユーザーが簡単に使えるようになるには、もう少し時間がかかるかもしれません。それでも、AIと人間のコンテンツを区別する新しいツールとして、SynthIDの需要はさらに高まっていくでしょう。
SynthIDの現状と今後の展望
GoogleのSynthID技術は、当初は画像と音声の識別に限定されていましたが、現在はテキストの識別機能も追加されています。この機能追加により、AIが生成したコンテンツをより幅広く識別できるようになりました。
利用可能な範囲も大きく広がっており、画像識別については、Vertex AIのImagenを使うユーザーだけでなく、より多くの開発者や企業が無料で利用可能。音声識別についても、一部のアーティストに限らず、より広い範囲のユーザーがベータ版を試せるようになっています。
テキスト識別の新機能は、Geminiアプリやウェブサービスで生成されたテキストにも適用され始めており、AIが作成した文章かどうかを判断しやすくなりました。
Googleは今後さまざまな製品にSynthIDを組み込んでいく計画を立てており、この取り組みによって、AIが作り出したコンテンツを責任を持って扱える環境が整っていくでしょう。
また、SynthID技術のオープンソース化も進められ、より多くの開発者がこの技術を自分たちのモデルに取り入れられるようになるはずです。
こうした動きは、AIが作り出すコンテンツの透明性を高め、フェイクニュースの拡散を防ぐのに役立つと期待されています。SynthIDの進化は、AIと人間が共存する未来の形を変えていく可能性を秘めているでしょう。
なお、音声生成AIついて詳しく知りたい方は、下記の記事を合わせてご確認ください。
SynthIDでAIコンテンツを識別しよう
近年AIが急速に発達してきたことによって、著作権の侵害や虚偽情報の発信など、これまでにさまざまな問題が起きていました。しかし、今回ご紹介したSynthIDを使用すれば、生成AIコンテンツを見極められるので、これらの問題を解決する第一歩が踏み出せたと感じています。
当初は画像と音声の識別に限られていたSynthIDですが、最新版ではテキストの識別機能も加わりました。さらに、利用できる範囲も大幅に広がっています。以前は一部の開発者やアーティストに限定されていましたが、現在は多くの企業や個人が無料で使えるようになりました。
Geminiアプリなど、実際のサービスでもSynthIDの導入が始まっています。AIが作ったコンテンツか、簡単に判断できるようになったのです。
そして2024年10月、GoogleはSynthIDのテキスト透かし機能をオープンソース化しました。この新機能により、より多くの人がAI識別技術を自由に使えるようになっています。今後、Googleはさまざまな製品にSynthIDが組み込まれていく見込みです。AIが作るコンテンツを責任を持って扱える環境が整っていくことでしょう。近い未来に備え、今からでもSynthIDをはじめとした、生成AIコンテンツを見極めるためのツールに関心を向けておくことをおすすめします。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
AI生成コンテンツの信頼性管理が課題の今、SynthIDの活用が大きな助けに。企業の生成AI導入を安全かつ信頼できる形で実現する第一歩として、SynthIDを活用してみてください。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。