【AI秘話】AIグラビアの元祖、ChilloutMixのTASUKUさんに画像生成AIの未来を語ってもらった
こんにちは、WEELメディア事業部です。
みなさん!今SNSで話題の「AIグラビア」ってご存知でしょうか?
生成AIが話題になったのと同時に、一気に広まった新しい概念なんです!
この度なんとAIグラビアの元祖、TASUKUさん(@TASUKU2023)とのインタビューが実現しました!
TASUKUさんは、リアルなAI美女が生成できちゃうStable Diffusionの派生モデル「ChilloutMix」を作られた方。顔出しありでTVに出演されたこともある、AIアートの伝道師なんです。
ということで、今回は2本立てです。まずは前半の当記事で、ChilloutMixの開発秘話や画像生成AIを取り囲む課題、その未来についてTASUKUさんのお話をお届けします。
後半では、画像生成AI黎明期から関わっていたTASUKUさんだからこそわかる、StableDiffusionにおける日本人コミュニティの貢献についてお届けします!
こちらからご確認ください!
ChilloutMixの開発秘話
まずはAIグラビアの先駆けとなった派生モデル・ChilloutMixの開発秘話を、TASUKUさんに聞いてみました。開発前の下積み期間から、順を追ってみていきましょう!
画像生成AIのスキルの磨き方
TASUKUさんは、モデルの作成技術をどのようにして身につけられたのでしょうか?元々画像処理を仕事でなさっていたんですか。
それが、違うんですよね。僕は全然IT系の人じゃないので、 本当にもうStable Diffusion上でできることをやってきたんです。
Stable Diffusion web UIだけをずっと触ってきた、ということですか?
そうですね。でも当時は3070(GeForce RTX 3070)のノートパソコンだったんですよ。だから、そんなにたくさんのことはできなかったんです。
よ、よくやりましたね……
いえいえ。マージ自体は本当に3分もかからないって感じだったんで。
当時から一応、ブレンド比を微調整する階層マージをゴリゴリやる人たちはいました。
ですけど僕はもう本当にシンプル。まずマージを試して当たりをつけてたら、運良くシンプルイズ・ザ・ベストでできた、みたいな感じだったんです。
なんとTASUKUさんは、独学で画像生成AIの技術を身につけてきたとのこと。飽くなき探究心でもって、AIグラビアの道を切り開かれたんですね。
ChilloutMixを支えるマージ元
ChilloutMixを作る際、モデル集めってやはり苦労されましたか?
はい。当時はモデルが少なかったんで、モデルファイルをダウンロードできるWebサイト「Civitai」で片っ端からマージしてましたね。
でもやっぱり、AIグラビアができるようになった技術として一番大きいのは「basil_mix」の功績かなと思ってます。
あ、そっか!ChilloutMixはbasil_mixから派生していたんですね。
そうなんですよ!それで何をマージしたかは全部、CivitaiのChilloutMixのページに書いてます。
それで、あともう一つ。体の仕上がりをより綺麗にするために、「Dreamlike Photoreal 2.0」も混ぜています。
そうなんですね!ちなみにアジア系の顔を生成させる際に役立っているモデルって、やっぱりbasil_mixなんでしょうか?
はい。basil_mixは基本的にアジア系の顔が得意かな、と思ってます。
なるほど!では顔つきをバジルミックスで担保した上で、細部を改良したんですね。
そうなんです!過去に出演したメディアさんには「ChilloutMixでAIの世界が変わった!」みたいな感じで、取り上げてもらったんですけど……
やっぱり僕自身は、これまでにマージをやってきたコミュニティの上に、 石を積んだぐらいのイメージでやってますね。
コミュニティの集合知で新しい使い方が生まれるというと、もはやある種の文化ですね!
TASUKUさんの考えるStable Diffusion最強装備
ここで読者のみなさんが待っているであろう、質問をさせていただきます。TASUKUさんにとっての「Stable Diffusion拡張機能の最強セット」があれば、教えていただけませんか?
いいですけど、多分めっちゃシンプルですよ。
僕が使っている拡張機能は、
● 豊かな表現を増やすための「Lora」
● 手足などの細部を整える「After Detailer」
● 元画像からポーズを抽出・反映できる「controlnet」
ぐらいなんです。
なるほど。逆に「変に入れすぎない方がいい」というものなんでしょうか?
プロンプトの内容はシンプルにしてます。
あとやっぱり、DALL-Eには独特の表現があるんですよね。
だから、気に入ったDALL-Eの画像を元に、コントロールネットなどを使って画像を作るようになりました!
あと、LoRA階層もやりますね。
そういえば、LoRA階層ってどんなことができるんですか?
LoRAって顔のタッチだけでなく、背景や衣装にも影響するんですよ。
だけどやっぱり、顔だけとか手だけとかで、タッチを変えたいじゃないですか。そんな時には拡張機能の「LoRA Block Weight」を使って、LoRA階層を施していますね。
ありがとうございます!
ChilloutMixのリリースを振り返って
次は、TASUKUさんにChilloutMixリリース当時の状況を振り返っていただきました。
TASUKUさんが顔出しする理由
この時代、なにを発信するにも炎上が隣り合わせですよね。そんな風潮のなか、TASUKUさんがあえて顔出しありでメディアに出演される理由について、お聞かせいただけると幸いです。
僕は「生産者が見える農家」みたいな気持ちで、顔出ししてます。
というと?
ChilloutMixをリリースした当時、コミュニティでは「リアルモデルを公にするなんてとんでもない!」という雰囲気が漂ってたんです。
そこに出そうものなら、一部のディープフェイクのような印象をうけて、フォトリアルAI自体が規制されるだろうな、と予想していました。
たしかに。今もSNS上で問題視されてますよね。
ですけど、リアルモデルは「実在の人、とくにタレントさんにとって役立つ技術」でもあるなと思ってまして。
だから過渡期の新しい技術に対して、どんどん得体の知れない怖いイメージがつくと良くないなと危惧していたんです。
ちょうどその時にテレビから取材が来たんで、顔出しをするって決めました。
なるほど、ありがとうございます。
批判を恐れず、AIの未来のために発信を続けるTASUKUさん。その原動力とは一体、なんなのでしょうか?次の質問に移りましょう。
ChilloutMixをリリースした動機
先ほどリアルモデルがタブー視されていた、とおっしゃってましたよね。ですけど逆に「パイオニア精神」的な、熱狂とか興奮とかはなかったんですか?
ChilloutMixを公開したとき、ここまでバズるとは思っていませんでした。なんか良いものを掘り当てたな、という気持ちでやってたら、それがCivitai上でどんどん盛り上がってきてたんですよ。
その反響から、ChilloutMixの面白さや価値を逆に理解しましたね。
なるほど。めちゃめちゃいい話ですね……
だから初めからバズ狙いだった、わけではないんです。
「良かったら使ってね」ぐらいの感じでコミュニティに還元したら、すごい盛り上がってたんです。
ただ「イラスト系モデルに使われるようなLoRAがリアル系モデルにも通用した」っていうのは、今振り返ってもめちゃくちゃ面白いなと思っています。
狙わずともバズを勝ち取れる、つまりそれだけChilloutMixがエポックメイキングなモデルだったんでしょう!
画像生成AIを取り囲む諸問題
今度はさらに踏み込んで、AIグラビアを取り囲む著作権・規制についても、TASUKUさんに聞いてみました。まずは「AIの著作権問題」について、当事者としての見解を語っていただきます。
LoRAがもつ著作権上のリスク
比較的簡単に画風などを学習できるLoRAは、論争の火種を産んでいますよね。
とくにアニメとか漫画とかの版権キャラクターをLoRAで学習させたモデルについては、SNS上で日夜激しい賛否両論の議論が繰り広げられていると思うんです。
はい。
そんなアニメ系のモデルをAIグラビアに応用した場合、著作権周りのリスクはあるんですか?
それは権利者側の判断によるところも大きいと思います。
たしかに「AI学習禁止」を公言されるクリエイターさんはいます。ですがなかには、「このキャラクターをみんなで再現してみて!」みたいな活動をなさっているクリエイターさんもいますよね。
たしかに。今日本で同人界隈が盛り上がってるぐらいですし、クリエイターさんによっては許してくれそうですよね。
著作権問題については、今後も激しい議論が続いていくと思います。ですができれば、画像生成AIのユーザーと権利者が共存できるような社会を目指したいですね。
TASUKUさんの考えるAI規制のあり方
今、法律周りをちらっと話したのはですね、日本でも始まりそうなAI規制についてのTASUKUさんの見解を聞きたかったからなんです。
弊社側の見解としては「寂しいな」と思ってるんですけど。
はい。
TASUKUさん的に「回避したい具体的な生成AI規制」というのはあったりしませんか?
規制の動向については結構注視しているんですけど、先のことはやっぱりわかりません。
ただ「AI=悪」という状況は避けたいですよね。
そうですね、それはそうです!
法律・権利周りの交通整備がなされれば、そこでどんどん技術が発展するんじゃないかな、というのが1ユーザーとしての意見です。
画像生成AIが論争を産む理由
著作権や規制の話だけでなく、その根本「AI推進派 vs. AI反対派」の戦いが起きる理由についても、TASUKUさんに答えていただきたく。
はい。
なぜ、生成AIばかりが批判を浴びているんでしょうか?
やっぱりその原因には法律的な部分だけでなく、感情的な部分っていうのが絶対にあると思います。
一部のAI推進派の方が言う「でも著作権法では別にこの手法は違法じゃないし」っていう言葉はかなりAI反対派の、それこそクリエイターさんの感情を逆撫でするものだと思うので。
たしかに。
だから僕らとしては、生成AIを使いたいし、どんどんその技術を発展させていきたいと思うんです。
だけどAI反対派の方を相手に、感情面への配慮を忘れたまま頭ごなしに主張する、というのは絶対に避けたいですよね。議論が平行線になってしまうので。
AIグラビアの将来を考える
現時点での話題だけでなくAIグラビアの将来についても、TASUKUさんに質問させていただいています。ここでもTASUKUさんの洞察が光ります!
「AIバレ」が起きる理由
「ずっとAIグラビアを見ていると目が慣れてしまう現象」つまりは「AIバレ」ですね。それについて、お聞きしたいことがあります。
はいはいはい。
われわれがAI画像を見破ってしまう原因って何だと思いますか?
それはある種の「不気味の谷」、つまりは似せきれていないってことだと思うんですよ。生身のグラビアとAIグラビアの間に、まだ越えられてない谷があるって感じですね。
だから、そのうち谷を超えてAIとリアルの見分けがつかなくなると思ってます。
やっぱり人間は「属人性」が好き
先ほどの不気味の谷について、さまざまな面から技術的アプローチが進められてると思うんです。
はい、そうですね。
それでTASUKUさんは、具体的に何が不気味の谷の原因だとお考えですか?
いやいやこれって、技術面だけが原因じゃないかもです。人はやっぱり属人性が好き、というのが僕の見立てで。
存在すると思ってた子が存在しなかった、というがっかり感が大きいんだと思いますよ。
それはご自身の経験談が元になっているんでしょうか?
実在のインフルエンサーさん・アイドルさんを画像生成AIで再現するコラボ企画で、それを実感しました。
AI画像だとわかってても好意的な意見を寄せてくれる方がいて。むしろそっちの方でインプレッションが多かったこともあるんです。
へぇ!なるほど。
あとコラボ相手の方を推しているみなさんも、
「AIと実物どっちも好きだよ」「実物の方が好きだよ」
「僕は見抜いたよ」「全然分かんなかった」
などなど、反応をくださったんです。
ということはオリジナルが実在していれば不気味の谷も越えられる、ということですか?
そこは好みの違いなんで、おのおのの楽しみ方だと思います。
ただ今は生身の人間のほうが、コミュニケーションが取れて楽しいですよね。AIグラビアだと画面から飛び出しては来ないので、 そこに属人性の無さを感じるのかもしれないですね。
技術だけでは超えられない「人間の性」が鍵になってきそう、ということなんですね。
次に来そうなAI系のムーブメントは?
ChilloutMixって、AIグラビアが流行るきっかけだったと思うんです。
その生みの親・TASUKUさんとしては、この流行・ムーブメントをどうお考えですか?
まあこの1年はみんなAIグラビアで楽しんでくれたんで、よかったなと思うんですよ。今の使い方で十分に面白いと思ってます。
だから要望はあまりないんです。けどやっぱり肖像権を侵害していないかはちゃんと意識した方がいいし、あとプラットフォームのルールには従った方がいいなと思います。そこは各個人の責任で頑張ってください!
あともう一つ!TASUKUさん的に、今後AIグラビアはどのように発展していくと予想してますか?
今、一部の有名なLoRAがだいぶ普及しているので、AIグラビア顔は似たり寄ったりになってきたな……と思うんです。
ただ生身のタレントさんがSNSに投稿する写真に、画像生成AIが使えるんじゃないかなと。カメラを使うと、撮影時の労力がかかりますしね。
だから僕は、そういうインフルエンサーさんとかアイドルさんとかに画像生成AIを届けていけたら、もっと面白い世の中になるんじゃないかなとは思います。
なるほど、おもしろいですね!
で、ゆくゆくはバーチャルヒューマンが主流になってきそうですよね。
それこそ時間と空間の壁を突破して、テレビの収録とYouTubeの配信を同時に行うとか。そうなるとおもしろいんじゃないかなとは思うんです。
もちろん実現にはStable Diffusion以外に、いろんな技術が必要になると思うんですけど。
画像生成AIがSNSを超えて各界で活躍していく未来、いいですね!その実現のために、弊社も発信を続けていく所存です!
動画生成AIについても聞いてみた
ビジュアリスティックな生成AIつながりで、動画生成AIへの想いもTASUKUさんに語っていただきました。まずは気になる動画媒体進出への意向から、みていきましょう!
動画版ChilloutMixのリリースは未定
TASUKUさんは現在、Stable DiffusionのChilloutMixを使ってグラビア画像を作られていますよね。でしたら、その兄弟にあたる画像生成AI・Stable Video Diffusionも扱えると思うんです。
はい。
そこで今後、動画生成AIに進出するご予定はありますでしょうか?
そうですね。それは今別件で、動画生成用のワークフロー・ソフトウェアの開発っていう形で、携わってるところなんです。個人で動画生成AIを扱うのはなかなか難しいんで、開発者で集まってやらないと。
では、動画分野でChilloutMix的なモデルを公開するつもりは今のところない、という感じですかね?
それは時勢に合わせて臨機応変に対応したいなと。
なるほど、そうなんですね!
OpenAI「Sora」についての所感
そういえば動画生成AI繋がりでもう一つ!2024年の2月に、OpenAIから「Sora」が出たじゃないですか。
Soraですね。
今後、Stable Video DiffusionのシェアがSoraに奪われてしまうかもしれませんよね。少なくとも拡張機能のバリエーションでは、まだStable Video Diffusionが勝ってると思いますけど。
それで、SoraはStable Video Diffusionのライバルたりえるのかどうかという点について、TASUKUさんの見解をお伺いしてもよろしいですか?
はい、まだまだStable Video Diffusionの立場はあるかなと。やっぱりOpenAIのようなビッグテックの生成AIは、刺激的な表現ができないんですよ。
コンテンツを作る場合は、検閲しすぎないStable Video Diffusionのほうがいいんじゃないかなってことですよね。
そうですね、Soraはサブカル感がちょっと足りないかなと。
たしかに!おっしゃる通りです。Soraもクオリティに関しては、申し分ないんですけど……
そう、めっちゃ綺麗でびっくりするんですよね!
ただアニメ的な過剰表現・突破力のある作品は作りづらいですよね。
そうですね。TikTokでバズる作品ではないですよね。
なるほど!すごい良いお言葉をいただきました。
コンプライアンスと表現力のバランスについては、今後も生成AIを語る上での題材になってきそうですね。
AIグラビアが切り開く表現の未来
今回はTASUKUさんへのインタビュー記事1回目、ChilloutMixの開発秘話や画像生成AIを取り囲む現状と未来についてお届けしました。AIグラビアの第一人者から見た、画像生成AIの未来像が浮き彫りになっていましたね。
さて次回は「StableDiffusionにおける日本人コミュニティの貢献」について、TASUKUさんからお話を伺っていきます!
ちなみに現在、TASUKUさんは「AiHUB / AIHUB株式会社」にて、著作権問題を克服した画像生成AIの開発を目指しています。AiHUBの活動内容については、こちらをご覧ください。
→AiHUBのトップページ
後編の記事はこちらからご確認ください。
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、サービス紹介資料もご用意しておりますので、併せてご確認ください。