i2i(image to image)とは?概要や著作権問題、気軽に試せる画像生成サービスを徹底解説
WEELメディアリサーチャーのいつきです。
生成AIの台頭初期では、テキストからテキスト、もしくは画像を生成する生成AIが主流でしたが、最近では画像から画像を生成するi2i(image to image)に注目が集まっています。
しかし、存在自体を知らない方や、存在を知っていても使いこなせていない方が多いのではないでしょうか。
そこで今回は、i2iでできることや活用シーンを具体的に解説していきます。
最後までお読みいただくと、i2iを使いこなせるようになるので、これまでよりも創作活動が捗ること間違いありません。
ぜひ最後までご覧ください。
「i2i(image to image)」の概要
i2iとは、image to imageの略で、入力した画像から新たな画像を生成する技術のことです。たとえば、入力した画像をアニメ風や水墨画風に変えたり、背景を変えたりといったことができます。
i2iで画像を生成または編集できる仕組みには、深層学習(ディープラーニング)の1種である敵対的生成ネットワーク(GAN)やDiffusionモデルを応用していることが挙げられます。
GANとDiffusionモデルの概要は以下のとおりです。
GAN:生成モデル (ジェネレーター)と識別モデル (ディスクリミネーター)の2つが互いに作用し合うことで、精度の高い画像を生成できる
Diffusionモデル:トレーニングの際はクリーンデータから徐々にノイズを加え、画像生成時にはノイズからクリーンデータを生成する反対のプロセスを採用している
これらの特性を持つ2つのモデルを活用することで、i2iによる高精度な画像生成を実現しています。
i2i(image to image)でできること4選
i2i(image to image)でできることの代表例を以下にまとめました。
- 画像のスタイルの変換
- 画像のカラー化
- テキスト・スケッチからの画像生成
- 画像の修復・解像度向上
以下でそれぞれ具体的なツール名も交えながら解説するので、ぜひ参考にしてみてください。
画像のスタイルの変換
i2iの代表的な使い方として、画像のスタイル変換が挙げられます。たとえば、リアルな写真をアニメスタイルやアートスタイルに変換可能です。
実際に、Evo-Nishikieという生成AIを使用すれば、入力した画像をもとに浮世絵スタイルの画像を新しく生成できます。
このような画像のスタイル変換を駆使すれば、ゲームやアニメなどのエンターテイメント分野に活かせそうです。
画像のカラー化
i2iを使えば、白黒画像のカラー化もお手のものです。GANの技術を搭載した生成AIであれば、画像から色情報を推測して、自然な見た目に仕上げてくれます。
こちらもEvo-Nishikieという生成AIが得意としており、色のない線画を入力するだけで色付きの錦絵を生成できます。漫画などのエンターテイメント分野のほか、古い歴史の写真を取り扱う教育分野での活躍が期待できそうです。
テキスト・スケッチからの画像生成
i2iが可能な生成AIモデルのなかには、テキスト・スケッチから画像を生成できるモデルが存在します。具体的には、GitHubで公開されている「flowty-realtime-lcm-canvas」がその一例です。
flowty-realtime-lcm-canvasを使ってスケッチ画像を入力すれば、より詳細化された画像を生成できます。たとえば、下手くそなクジラのスケッチを入力したら、プロの絵師が書いたような高精度の画像が出力されるといった具合です。
将来的には、i2iを使って誰でも漫画家になれる未来が来るかもしれませんね!
flowty-realtime-lcm-canvasについて詳しくは、以下の記事で解説しています。
画像の修復・解像度向上
i2iに対応したモデルなら、画像の修復や解像度の向上も可能です。これは、i2iに対応したモデルがGANの技術を搭載していることが関係しています。
GANを用いたi2iモデルなら、周囲の画像から特定の欠損部位に適したパーツを推測して補完できるので、違和感のない見た目に仕上げられます。また、ノイズ除去も可能にしていることから、解像度の向上もできるというわけです。
なお、画像生成AIの活用事例について詳しく知りたい方は、下記の記事を合わせてご確認ください。
i2i(image to image)の活用シーン・実例4選
ここからは、i2i(image to image)の具体的な活用シーンや実例を紹介していきます。
今回紹介するのは、以下の4つです。
- 【医療】MRIからCT画像の生成
- 【広告】商品写真からバナーの生成
- 【EC】人物写真から試着画像の生成
- 【教育・考古学】歴史資料のカラー化
それぞれの活用シーンを紹介していくので、真似できそうなものから試してみてください。
【医療】MRIからCT画像の生成
i2iの利用は、医療分野においても進められています。具体的には、GE Healthcareが生成AIによってMRIからCT画像を生成するAIソリューションを開発し、これが大きな注目を集めました。※1
このAIソリューションは、画像再構成技術と画像変換技術を組み合わせることにより、入力したMRI画像のノイズの低減や高画質化を実現しているとのこと。
さらに、再構成したMRI画像を軟部組織を詳細に描写したCT画像へと変換できるとしています。
医療分野でこの取り組みが進んでいけば、病変の見落としが減りつつ、CT画像を撮るための放射線被曝もなくなるとのことで、大きな期待が寄せられています。
【広告】商品写真からバナーの生成
i2iのモデルは、商品写真からバナーの生成ができます。実際にサイバーエージェントが開発した「極予測AI」というモデルが登場しており、広告効果の高いバナーを生成できるようになりました。
このモデルには、サイバーエージェントが保有しているインターネット広告のデータが学習されているのが特徴です。生成した画像と既存広告のスコアを比較して、高スコアの広告のみを提案する仕組みが備わっています。
極予測AIについて詳しく知りたい方は、以下の記事をご確認ください。
【EC】人物写真から試着画像の生成
i2iモデルを使って、人物写真から試着画像を生成できるサービスも開発されています。バーチャル試着用生成AI「IDM-VTON」が代表例で、人物写真をアップロードして服装画像を指定するだけで、簡単に試着画像を生成可能です。
この使い方が普及していけば、ECにおける大きな弱点だった「試着ができない」という問題を解決できます。ECの利便性向上がますます進んでいくので、かなり楽しみですね!
IDM-VTONについては、以下の記事で詳しく解説しています。
【教育・考古学】歴史資料のカラー化
i2iモデルは、歴史資料のカラー化ができることから、教育や考古学分野での活躍が期待されています。Sakana AI社が開発したEvo-Nishikieがその一例です。
このモデルは、ControlNetにより多色摺の浮世絵やそれを線画に変換した画像を学習しており、入力画像の特徴を保ったままの着彩・生成を可能にしています。
なお、Evo-Nishikieについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
i2i(image to image)の著作権問題
i2i(image to image)で生成された画像に対する著作権については、明確なルールや法律が定められていません。ただし、1つの目安として文化庁が「A I と著作権」という資料を公開しています。
この資料によると、アイデアや画風などに著作権は発生しないものの、類似性や依拠性などの観点から、故意に他人の作品を真似した場合は著作権違反として罪に問われる可能性があるとしています。
実際にあった事例だと、X(旧Twitter)に自分の作品を投稿していた絵師が他人の作品をi2i技術を使ってトレパクしていたといった出来事がありネット上で炎上しました。
このようにトレパクで他人の作品に類似した画像を公開するといった悪質な事例も横行しているので、今後の動向に注目していきましょう。
i2i(image to image)が気軽に試せる画像生成サービス3選
ここからは、i2i(image to image)が気軽に試せる画像生成サービス3選をご紹介していきます。
今回紹介するのは、以下3つのサービスです。
- MyEdit
- Leonardo AI
- Midjourney
それぞれの特徴を解説していくので、気に入ったサービスがあればぜひ利用してみてください。
MyEdit
MyEditは、オンライン上で画像加工や編集ができるAI画像編集サイトです。
i2i(image to image)を駆使して、以下のようなことができます。
- 画像に写っている人やオブジェクトの削除
- 画像内の一部をAI生成物に置き換え
- 2枚の画像をフュージョンして新たな画像を生成
- 画像の写っていない部分を補完
- 画像の高画質化
- 画像のノイズ除去
- 画像をアニメスタイルに変更
i2iでできることとして挙げた多くの機能をカバーしているので、幅広い分野で活用できます。無料でも一部の機能を使えるので、ぜひ試してみてください。
Leonardo AI
Leonardo AIは、画像生成や編集がリアルタイムでできる生成AIサービスです。Stable Diffusionをベースとした画像生成モデルで高精度な画像を生成できるほか、便利な機能を多数取り揃えています。
たとえば、低解像度の画像を高画質化する「Universal Upscaler」が便利です。i2i以外にも、入力した画像をアニメーション化する機能なども備わっています。
なお、Leonardo AIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
Midjourney
Midjourneyは、Stable Diffusionとともに画像生成AIを代表するAIプログラムです。Discordのサーバー上で利用ができ、i2iを含むさまざまな機能を備えています。
たとえば、現実の写真をアニメスタイルに変換したり、逆にイラストをリアルな画風に変換したりもできます。合わせて適切なプロンプトを組み合わせれば、より高精度な画像を生成できるので、ぜひ試してみてください。
なお、Midjourneyについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
i2i(image to image)で画像生成の可能性を広げよう
i2i(image to image)は、入力した画像から新たな画像を生成する技術です。既存画像をアニメスタイルに変更したり、足りない部分を補完したりできます。
当記事でも紹介した、i2iでできることを再度まとめました。
【i2iでできること】
- 画像のスタイルの変換
- 画像のカラー化
- テキスト・スケッチからの画像生成
- 画像の修復・解像度向上
i2iは上記のようなことができるため、医療・教育・エンタメといった幅広い業界での活躍が期待されています。すでに、i2iができるサービスは多く登場しているので、画像生成の可能性を広げるためにも一度利用してみてください。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
「i2i(image to image)」の導入は、企業のプロダクト開発やクリエイティブに革命をもたらします。既存の画像データを活用したり、新たなビジュアルを生成したりすることで、制作コスト削減と創造性の強化を同時に実現することでしょう。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。