【AI秘話】AIグラビアの元祖、ChilloutMixのTASUKUさんに画像生成AIの未来を語ってもらった

2024-03-252024-04-01

こんにちは、WEELメディア事業部です。

みなさん！今SNSで話題の「AIグラビア」ってご存知でしょうか？
生成AIが話題になったのと同時に、一気に広まった新しい概念なんです！

この度なんとAIグラビアの元祖、TASUKUさん（@TASUKU2023）とのインタビューが実現しました！

TASUKUさんは、リアルなAI美女が生成できちゃうStable Diffusionの派生モデル「ChilloutMix」を作られた方。顔出しありでTVに出演されたこともある、AIアートの伝道師なんです。

ということで、今回は2本立てです。まずは前半の当記事で、ChilloutMixの開発秘話や画像生成AIを取り囲む課題、その未来についてTASUKUさんのお話をお届けします。

後半では、画像生成AI黎明期から関わっていたTASUKUさんだからこそわかる、StableDiffusionにおける日本人コミュニティの貢献についてお届けします！
こちらからご確認ください！

ChilloutMixの開発秘話

まずはAIグラビアの先駆けとなった派生モデル・ChilloutMixの開発秘話を、TASUKUさんに聞いてみました。開発前の下積み期間から、順を追ってみていきましょう！

画像生成AIのスキルの磨き方

WEEL

TASUKUさんは、モデルの作成技術をどのようにして身につけられたのでしょうか？元々画像処理を仕事でなさっていたんですか。

TASUKUさん

それが、違うんですよね。僕は全然IT系の人じゃないので、本当にもうStable Diffusion上でできることをやってきたんです。

WEEL

Stable Diffusion web UIだけをずっと触ってきた、ということですか？

TASUKUさん

そうですね。でも当時は3070（GeForce RTX 3070）のノートパソコンだったんですよ。だから、そんなにたくさんのことはできなかったんです。

WEEL

よ、よくやりましたね……

TASUKUさん

いえいえ。マージ自体は本当に3分もかからないって感じだったんで。

TASUKUさん

当時から一応、ブレンド比を微調整する階層マージをゴリゴリやる人たちはいました。

TASUKUさん

ですけど僕はもう本当にシンプル。まずマージを試して当たりをつけてたら、運良くシンプルイズ・ザ・ベストでできた、みたいな感じだったんです。

WEEL

なんとTASUKUさんは、独学で画像生成AIの技術を身につけてきたとのこと。飽くなき探究心でもって、AIグラビアの道を切り開かれたんですね。

ChilloutMixを支えるマージ元

WEEL

ChilloutMixを作る際、モデル集めってやはり苦労されましたか?

TASUKUさん

はい。当時はモデルが少なかったんで、モデルファイルをダウンロードできるWebサイト「Civitai」で片っ端からマージしてましたね。

TASUKUさん

でもやっぱり、AIグラビアができるようになった技術として一番大きいのは「basil_mix」の功績かなと思ってます。

WEEL

あ、そっか！ChilloutMixはbasil_mixから派生していたんですね。

TASUKUさん

そうなんですよ！それで何をマージしたかは全部、CivitaiのChilloutMixのページに書いてます。

TASUKUさん

それで、あともう一つ。体の仕上がりをより綺麗にするために、「Dreamlike Photoreal 2.0」も混ぜています。

WEEL

そうなんですね！ちなみにアジア系の顔を生成させる際に役立っているモデルって、やっぱりbasil_mixなんでしょうか？

TASUKUさん

はい。basil_mixは基本的にアジア系の顔が得意かな、と思ってます。

WEEL

なるほど！では顔つきをバジルミックスで担保した上で、細部を改良したんですね。

TASUKUさん

そうなんです！過去に出演したメディアさんには「ChilloutMixでAIの世界が変わった！」みたいな感じで、取り上げてもらったんですけど……

TASUKUさん

やっぱり僕自身は、これまでにマージをやってきたコミュニティの上に、石を積んだぐらいのイメージでやってますね。

WEEL

コミュニティの集合知で新しい使い方が生まれるというと、もはやある種の文化ですね！

TASUKUさんの考えるStable Diffusion最強装備

WEEL

ここで読者のみなさんが待っているであろう、質問をさせていただきます。TASUKUさんにとっての「Stable Diffusion拡張機能の最強セット」があれば、教えていただけませんか？

TASUKUさん

いいですけど、多分めっちゃシンプルですよ。

TASUKUさん

僕が使っている拡張機能は、
● 豊かな表現を増やすための「Lora」
● 手足などの細部を整える「After Detailer」
● 元画像からポーズを抽出・反映できる「controlnet」
ぐらいなんです。

WEEL

なるほど。逆に「変に入れすぎない方がいい」というものなんでしょうか？

TASUKUさん

プロンプトの内容はシンプルにしてます。

TASUKUさん

あとやっぱり、DALL-Eには独特の表現があるんですよね。
だから、気に入ったDALL-Eの画像を元に、コントロールネットなどを使って画像を作るようになりました！

TASUKUさん

あと、LoRA階層もやりますね。

WEEL

そういえば、LoRA階層ってどんなことができるんですか？

TASUKUさん

LoRAって顔のタッチだけでなく、背景や衣装にも影響するんですよ。

TASUKUさん

だけどやっぱり、顔だけとか手だけとかで、タッチを変えたいじゃないですか。そんな時には拡張機能の「LoRA Block Weight」を使って、LoRA階層を施していますね。

WEEL

ありがとうございます！

このLoRA階層については後半、2つ目の記事で詳しく触れていきます。

ChilloutMixのリリースを振り返って

次は、TASUKUさんにChilloutMixリリース当時の状況を振り返っていただきました。

TASUKUさんが顔出しする理由

WEEL

この時代、なにを発信するにも炎上が隣り合わせですよね。そんな風潮のなか、TASUKUさんがあえて顔出しありでメディアに出演される理由について、お聞かせいただけると幸いです。

皆さま、一週間お疲れさまでした。
告知です。16日(日)の午前１０時から
フジテレビ様の「ワイドナショー」
に出演させていただくことになりました。
まだちょっと最終的にどんな感じになるかはまだわかりませんが、よかったら見てください。
それでは今日は早めですがおやすみなさい～～～。 pic.twitter.com/x3yso0wTns
— TASUKU2023 (@TASUKU2023) April 14, 2023

TASUKUさん

僕は「生産者が見える農家」みたいな気持ちで、顔出ししてます。

WEEL

というと？

TASUKUさん

ChilloutMixをリリースした当時、コミュニティでは「リアルモデルを公にするなんてとんでもない！」という雰囲気が漂ってたんです。

TASUKUさん

そこに出そうものなら、一部のディープフェイクのような印象をうけて、フォトリアルAI自体が規制されるだろうな、と予想していました。

WEEL

たしかに。今もSNS上で問題視されてますよね。

TASUKUさん

ですけど、リアルモデルは「実在の人、とくにタレントさんにとって役立つ技術」でもあるなと思ってまして。

リアル系AIの活用法案
・２Dキャラのリアル化
・Vtuberやタレント化
・実在人物をインフルエンス
・動画作成、スタント等に使える。
・実在人物とAIとのコラボ
・常駐アプリや街頭モニターとして表示
・店舗、医療、講座、WebサイトのAIchat等で使用できるアプリに活用etc.
一緒にやりませんか？ pic.twitter.com/9VlGwAZdoB
— TASUKU2023 (@TASUKU2023) March 20, 2023

TASUKUさん

だから過渡期の新しい技術に対して、どんどん得体の知れない怖いイメージがつくと良くないなと危惧していたんです。

TASUKUさん

ちょうどその時にテレビから取材が来たんで、顔出しをするって決めました。

WEEL

なるほど、ありがとうございます。

WEEL

批判を恐れず、AIの未来のために発信を続けるTASUKUさん。その原動力とは一体、なんなのでしょうか？次の質問に移りましょう。

ChilloutMixをリリースした動機

WEEL

先ほどリアルモデルがタブー視されていた、とおっしゃってましたよね。ですけど逆に「パイオニア精神」的な、熱狂とか興奮とかはなかったんですか？

TASUKUさん

ChilloutMixを公開したとき、ここまでバズるとは思っていませんでした。なんか良いものを掘り当てたな、という気持ちでやってたら、それがCivitai上でどんどん盛り上がってきてたんですよ。

TASUKUさん

その反響から、ChilloutMixの面白さや価値を逆に理解しましたね。

WEEL

なるほど。めちゃめちゃいい話ですね……

TASUKUさん

だから初めからバズ狙いだった、わけではないんです。

TASUKUさん

「良かったら使ってね」ぐらいの感じでコミュニティに還元したら、すごい盛り上がってたんです。

TASUKUさん

ただ「イラスト系モデルに使われるようなLoRAがリアル系モデルにも通用した」っていうのは、今振り返ってもめちゃくちゃ面白いなと思っています。

WEEL

狙わずともバズを勝ち取れる、つまりそれだけChilloutMixがエポックメイキングなモデルだったんでしょう！

画像生成AIを取り囲む諸問題

今度はさらに踏み込んで、AIグラビアを取り囲む著作権・規制についても、TASUKUさんに聞いてみました。まずは「AIの著作権問題」について、当事者としての見解を語っていただきます。

LoRAがもつ著作権上のリスク

WEEL

比較的簡単に画風などを学習できるLoRAは、論争の火種を産んでいますよね。

WEEL

とくにアニメとか漫画とかの版権キャラクターをLoRAで学習させたモデルについては、SNS上で日夜激しい賛否両論の議論が繰り広げられていると思うんです。

TASUKUさん

はい。

WEEL

そんなアニメ系のモデルをAIグラビアに応用した場合、著作権周りのリスクはあるんですか？

TASUKUさん

それは権利者側の判断によるところも大きいと思います。

TASUKUさん

たしかに「AI学習禁止」を公言されるクリエイターさんはいます。ですがなかには、「このキャラクターをみんなで再現してみて！」みたいな活動をなさっているクリエイターさんもいますよね。

WEEL

たしかに。今日本で同人界隈が盛り上がってるぐらいですし、クリエイターさんによっては許してくれそうですよね。

WEEL

著作権問題については、今後も激しい議論が続いていくと思います。ですができれば、画像生成AIのユーザーと権利者が共存できるような社会を目指したいですね。

TASUKUさんの考えるAI規制のあり方

WEEL

今、法律周りをちらっと話したのはですね、日本でも始まりそうなAI規制についてのTASUKUさんの見解を聞きたかったからなんです。

WEEL

弊社側の見解としては「寂しいな」と思ってるんですけど。

TASUKUさん

はい。

WEEL

TASUKUさん的に「回避したい具体的な生成AI規制」というのはあったりしませんか？

TASUKUさん

規制の動向については結構注視しているんですけど、先のことはやっぱりわかりません。

TASUKUさん

ただ「AI＝悪」という状況は避けたいですよね。

WEEL

そうですね、それはそうです！

TASUKUさん

法律・権利周りの交通整備がなされれば、そこでどんどん技術が発展するんじゃないかな、というのが1ユーザーとしての意見です。

画像生成AIが論争を産む理由

WEEL

著作権や規制の話だけでなく、その根本「AI推進派 vs. AI反対派」の戦いが起きる理由についても、TASUKUさんに答えていただきたく。

TASUKUさん

はい。

WEEL

なぜ、生成AIばかりが批判を浴びているんでしょうか？

TASUKUさん

やっぱりその原因には法律的な部分だけでなく、感情的な部分っていうのが絶対にあると思います。

TASUKUさん

一部のAI推進派の方が言う「でも著作権法では別にこの手法は違法じゃないし」っていう言葉はかなりAI反対派の、それこそクリエイターさんの感情を逆撫でするものだと思うので。

WEEL

たしかに。

TASUKUさん

だから僕らとしては、生成AIを使いたいし、どんどんその技術を発展させていきたいと思うんです。

TASUKUさん

だけどAI反対派の方を相手に、感情面への配慮を忘れたまま頭ごなしに主張する、というのは絶対に避けたいですよね。議論が平行線になってしまうので。

AIグラビアの将来を考える

現時点での話題だけでなくAIグラビアの将来についても、TASUKUさんに質問させていただいています。ここでもTASUKUさんの洞察が光ります！

「AIバレ」が起きる理由

WEEL

「ずっとAIグラビアを見ていると目が慣れてしまう現象」つまりは「AIバレ」ですね。それについて、お聞きしたいことがあります。

TASUKUさん

はいはいはい。

WEEL

われわれがAI画像を見破ってしまう原因って何だと思いますか？

TASUKUさん

それはある種の「不気味の谷」、つまりは似せきれていないってことだと思うんですよ。生身のグラビアとAIグラビアの間に、まだ越えられてない谷があるって感じですね。

TASUKUさん

だから、そのうち谷を超えてAIとリアルの見分けがつかなくなると思ってます。

やっぱり人間は「属人性」が好き

WEEL

先ほどの不気味の谷について、さまざまな面から技術的アプローチが進められてると思うんです。

TASUKUさん

はい、そうですね。

WEEL

それでTASUKUさんは、具体的に何が不気味の谷の原因だとお考えですか？

TASUKUさん

いやいやこれって、技術面だけが原因じゃないかもです。人はやっぱり属人性が好き、というのが僕の見立てで。

TASUKUさん

存在すると思ってた子が存在しなかった、というがっかり感が大きいんだと思いますよ。

WEEL

それはご自身の経験談が元になっているんでしょうか？

TASUKUさん

実在のインフルエンサーさん・アイドルさんを画像生成AIで再現するコラボ企画で、それを実感しました。

TASUKUさん

AI画像だとわかってても好意的な意見を寄せてくれる方がいて。むしろそっちの方でインプレッションが多かったこともあるんです。

WEEL

へぇ！なるほど。

TASUKUさん

あとコラボ相手の方を推しているみなさんも、
「AIと実物どっちも好きだよ」「実物の方が好きだよ」
「僕は見抜いたよ」「全然分かんなかった」
などなど、反応をくださったんです。

WEEL

ということはオリジナルが実在していれば不気味の谷も越えられる、ということですか？

TASUKUさん

そこは好みの違いなんで、おのおのの楽しみ方だと思います。

TASUKUさん

ただ今は生身の人間のほうが、コミュニケーションが取れて楽しいですよね。AIグラビアだと画面から飛び出しては来ないので、そこに属人性の無さを感じるのかもしれないですね。

WEEL

技術だけでは超えられない「人間の性」が鍵になってきそう、ということなんですね。

次に来そうなAI系のムーブメントは？

WEEL

ChilloutMixって、AIグラビアが流行るきっかけだったと思うんです。
その生みの親・TASUKUさんとしては、この流行・ムーブメントをどうお考えですか？

TASUKUさん

まあこの1年はみんなAIグラビアで楽しんでくれたんで、よかったなと思うんですよ。今の使い方で十分に面白いと思ってます。

TASUKUさん

だから要望はあまりないんです。けどやっぱり肖像権を侵害していないかはちゃんと意識した方がいいし、あとプラットフォームのルールには従った方がいいなと思います。そこは各個人の責任で頑張ってください！

WEEL

あともう一つ！TASUKUさん的に、今後AIグラビアはどのように発展していくと予想してますか？

TASUKUさん

今、一部の有名なLoRAがだいぶ普及しているので、AIグラビア顔は似たり寄ったりになってきたな……と思うんです。

TASUKUさん

ただ生身のタレントさんがSNSに投稿する写真に、画像生成AIが使えるんじゃないかなと。カメラを使うと、撮影時の労力がかかりますしね。

TASUKUさん

だから僕は、そういうインフルエンサーさんとかアイドルさんとかに画像生成AIを届けていけたら、もっと面白い世の中になるんじゃないかなとは思います。

WEEL

なるほど、おもしろいですね！

TASUKUさん

で、ゆくゆくはバーチャルヒューマンが主流になってきそうですよね。

TASUKUさん

それこそ時間と空間の壁を突破して、テレビの収録とYouTubeの配信を同時に行うとか。そうなるとおもしろいんじゃないかなとは思うんです。

TASUKUさん

もちろん実現にはStable Diffusion以外に、いろんな技術が必要になると思うんですけど。

WEEL

画像生成AIがSNSを超えて各界で活躍していく未来、いいですね！その実現のために、弊社も発信を続けていく所存です！

動画生成AIについても聞いてみた

ビジュアリスティックな生成AIつながりで、動画生成AIへの想いもTASUKUさんに語っていただきました。まずは気になる動画媒体進出への意向から、みていきましょう！

動画版ChilloutMixのリリースは未定

WEEL

TASUKUさんは現在、Stable DiffusionのChilloutMixを使ってグラビア画像を作られていますよね。でしたら、その兄弟にあたる画像生成AI・Stable Video Diffusionも扱えると思うんです。

動画テスト！！ pic.twitter.com/IQBihTzCIX
— TASUKU2023 (@TASUKU2023) April 24, 2023

TASUKUさん

はい。

WEEL

そこで今後、動画生成AIに進出するご予定はありますでしょうか？

TASUKUさん

そうですね。それは今別件で、動画生成用のワークフロー・ソフトウェアの開発っていう形で、携わってるところなんです。個人で動画生成AIを扱うのはなかなか難しいんで、開発者で集まってやらないと。

WEEL

では、動画分野でChilloutMix的なモデルを公開するつもりは今のところない、という感じですかね？

TASUKUさん

それは時勢に合わせて臨機応変に対応したいなと。

WEEL

なるほど、そうなんですね！

OpenAI「Sora」についての所感

WEEL

そういえば動画生成AI繋がりでもう一つ！2024年の2月に、OpenAIから「Sora」が出たじゃないですか。

TASUKUさん

Soraですね。

WEEL

今後、Stable Video DiffusionのシェアがSoraに奪われてしまうかもしれませんよね。少なくとも拡張機能のバリエーションでは、まだStable Video Diffusionが勝ってると思いますけど。

WEEL

それで、SoraはStable Video Diffusionのライバルたりえるのかどうかという点について、TASUKUさんの見解をお伺いしてもよろしいですか？

TASUKUさん

はい、まだまだStable Video Diffusionの立場はあるかなと。やっぱりOpenAIのようなビッグテックの生成AIは、刺激的な表現ができないんですよ。

WEEL

コンテンツを作る場合は、検閲しすぎないStable Video Diffusionのほうがいいんじゃないかなってことですよね。

TASUKUさん

そうですね、Soraはサブカル感がちょっと足りないかなと。

WEEL

たしかに！おっしゃる通りです。Soraもクオリティに関しては、申し分ないんですけど……

TASUKUさん

そう、めっちゃ綺麗でびっくりするんですよね！

WEEL

ただアニメ的な過剰表現・突破力のある作品は作りづらいですよね。

TASUKUさん

そうですね。TikTokでバズる作品ではないですよね。

WEEL

なるほど！すごい良いお言葉をいただきました。

WEEL

コンプライアンスと表現力のバランスについては、今後も生成AIを語る上での題材になってきそうですね。

AIグラビアが切り開く表現の未来

今回はTASUKUさんへのインタビュー記事1回目、ChilloutMixの開発秘話や画像生成AIを取り囲む現状と未来についてお届けしました。AIグラビアの第一人者から見た、画像生成AIの未来像が浮き彫りになっていましたね。

さて次回は「StableDiffusionにおける日本人コミュニティの貢献」について、TASUKUさんからお話を伺っていきます！

ちなみに現在、TASUKUさんは「AiHUB / AIHUB株式会社」にて、著作権問題を克服した画像生成AIの開発を目指しています。AiHUBの活動内容については、こちらをご覧ください。
→AiHUBのトップページ

後編の記事はこちらからご確認ください。

最後に

いかがだったでしょうか？

GPT-3.5 Turboの最新アップデートで、より高速かつ低コストでのAI活用が可能になりました。自社での導入・活用を検討する際に、最適なモデル選定や活用方法について、一緒に考えてみませんか？

弊社では

・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発

などの開発実績がございます。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ