【Animagine XL 2.0】解像度が高すぎるアニメ画像を生成できちゃうAIを使って推しの女の子を作ってみた

2024-01-212024-07-12

Animagine XL 2.0は、高解像度で詳細なアニメ画像を生成するために設計された先進的な潜在テキストから画像への拡散モデルです。このモデルは、Stable Diffusion XL 1.0をベースに、高品質のアニメスタイル画像データセットを使用して追加学習され、微調整されています。

Animagine XL 2.0を使用すると、以下のような画像が生成できます。

とても高画質で綺麗なアニメ画像ですよね！このモデルはまるで、ドラえもんの道具であるマンガカメラ（対象が漫画風の絵に変わるカメラ）のように、対象（プロンプト）をアニメ風、漫画風の画像に変更できます。

この記事では、Animagine XL 2.0の概要や特徴、実際に使ってみた内容を紹介します。最後までご覧いただくことで、Animagine XL 2.0の概要や使い方がわかり、多くのアニメ画像を生成できるようになるでしょう。

＼生成AIを活用して業務プロセスを自動化／

【無料】専門家に相談する

Animagine XL 2.0

前バージョンのAnimagine XL 1.0に比べ、多様で独特なスタイルの画像を生成できるようになっており、画像の解像度などの品質も向上しています。

Animagine XL 2.0をLoRAアダプターによって補完することで、生成画像にパステルスタイルやスケッチスタイルなど様々なスタイルを与えるモデルも公開されました。

詳しくは、以下のリンクから確認してみてください。

参考記事：HuggingFace「ANIMAGINE XL 2.0」

Animagine XL 2.0は、開発者より最適なプロンプトの書き方が示されており、例えば以下のように入力すると良い画像が生成されます。

1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck

文章で入力するのではなく、カンマで区切って入力することで最適な結果が得られるということですね。

また、negative promptについても、高品質な画像生成に最適なものが公開されており、以下のプロンプトを入力することがおすすめです。

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

negative promptはこのまま固定でよさそうですね。

次に、Animagine XL 2.0で生成されたサンプル画像をいくつか紹介します。

プロンプト

"prompt": "cinematic photo (masterpiece), (best quality), (ultra-detailed),  caelus, honkai: star rail, 1boy, solo, playing guitar, living room, grey hair, short hair, yellow eyes, downturned eyes, passionate expression, casual clothes, acoustic guitar, sheet music stand, carpet, couch, window, sitting pose, strumming guitar, eyes closed., illustration, disheveled hair, detailed eyes, perfect composition, moist skin, intricate details, earrings . 35mm photograph, film, bokeh, professional, 4k, highly detailed",

"negative_prompt": "drawing, painting, crayon, sketch, graphite, impressionist, noisy, blurry, soft, deformed, uglylongbody, lowres, bad anatomy, bad hands, missing fingers, pubic hair, extra digit, fewer digits, cropped, worst quality, low quality",

画像

プロンプト

"prompt": "cinematic photo (masterpiece), (best quality), (ultra-detailed), 1girl, solo, kafka, enjoying a street food festival, dark purple hair, shoulder length, hair clip, blue eyes, upturned eyes, excited expression, casual clothes, food stalls, variety of cuisines, people, outdoor seating, string lights, standing pose, holding a plate of food, trying new dishes, laughing with friends, experiencing the vibrant food culture., illustration, disheveled hair, detailed eyes, perfect composition, moist skin, intricate details, earrings . 35mm photograph, film, bokeh, professional, 4k, highly detailed",

"negative_prompt": "drawing, painting, crayon, sketch, graphite, impressionist, noisy, blurry, soft, deformed, uglylongbody, lowres, bad anatomy, bad hands, missing fingers, pubic hair, extra digit, fewer digits, cropped, worst quality, low quality",

どちらの画像も忠実にプロンプトを再現しており、解像度もとても高いです。

特に2枚目の画像は、メインの女の子だけでなく、背景の人物まで細かく描写されており、このモデルの性能の高さが分かりますね。

Animagine XL 2.0は、以下の表にある画像サイズに対応しており、目的に合わせて様々なサイズの画像を生成可能です。

Animagine XL 2.0は商用利用できる？

結論から言うと、Animagine XL 2.0は商用可能です！

Animagine XL 2.0は、「 CreativeML Open RAIL++-M 」というライセンスを使用しています。これは、Stable Diffusionと同じライセンスです。しかし、商用利用が可能なツールでも、特定の条件下では商用利用ができなくなるケースがあります。ここでは、商用利用ができなくなる状況を3つ具体的に紹介します。

参考記事：ライセンス「CreativeML Open RAIL++-M」

＼画像生成AIを商用利用する際はライセンスを確認しましょう／

商用利用できないモデルを使用

商用利用できないモデルを使用している場合は、商用利用できません。

たとえば、Stable Diffusionに「ChilloutMix」を学習させた場合は、商用利用不可となります。「ChilloutMix」は、商用利用ができないモデルです。このようなモデルで作成された画像をビジネスで使うと、著作権侵害になる恐れがあります。

商用利用が不可のモデルを使用してしまうと、法的なトラブルに巻き込まれるため、必ずモデルのライセンスを確認しましょう。

商用利用できないモデルをLoraで学習

「Lora」は、特定のモデルや画像を追加で学習させる機能です。しかし、この機能で使用されるモデルや画像が商用利用不可の場合、それに基づいて生成された新しい画像も商用利用できません。

例を挙げると、特定のアニメキャラクターを模倣するために商用利用不可のモデルを学習させた場合、そのキャラクターの著作権を持つ企業から訴えられるリスクがあります。

Loraを使用する際は、著作権やライセンスの条件をしっかりと理解し、遵守することが重要です。

商用利用できない画像を読み込み

商用利用が許可されていない画像を読み込んで新しい画像を生成した場合、その新しい画像も同様に商用利用できません。

具体的には、他社が著作権を持つロゴやアートワークを元にして新しいデザインを作成した場合、それは著作権侵害にあたります。つまり、どんなに創造的な生成画像であっても、元となる画像の著作権を尊重する必要があるのです。

そのため、商用目的で画像を生成する際は、使用する画像の著作権状況をきちんと確認し、リスクを避けることが大切です。

なお、Animagine XL 2.0の進化版を知りたい方はこちらの記事をご覧ください。
→【Animagine XL 3.0】誰でも簡単にアニメ美少女の画像を生成できる神AI！使い方や料金、使ってみた感想を紹介

Animagine XL 2.0の利用料金

Animagine XL 2.0は、無料で利用可能です！

このツールは、「Hugging Face」や「Google Colab」を通じて利用することが可能で、いずれも利用料金は不要です。さらに、Animagine XL 2.0はプロンプトを入力するだけで簡単に使用でき商用利用も可能なため、イラスト制作やキャラクターデザインに関わる業務で大きなコスト削減が見込めます。

Animagine XL 2.0は、画像生成に時間がかかりますが、無料でこのクオリティーの画像を生成できるのは非常に魅力的です。

Animagine XL 2.0の使い方

現在Animagine XL 2.0の使い方は、以下の2種類があります。

Gradio Web UI

参考記事：animagine-xl

Google Colab

参考記事：Animagine_XL_demo.ipynb

Gradio Web UIは、Hugging FaceのSpaceにアクセスするだけで利用可能です。Google Colabは、自分の環境でノートブックを実行して画像を生成するので、Google Colab proに加入している方は、A100GPUで実装することをお勧めします。

今回は、簡単に使えて詳細設定もできるGradio Web UIを使用します。

なお、高性能画像生成AIについて知りたい方はこちらの記事をご覧ください。
→【RPG-DiffusionMaster】超高性能画像生成AIでめちゃめちゃ可愛いAI美女を作ってみた

Animagine XL 2.0を実際に使ってみた

Hugging FaceのSpaceにアクセスすると、以下のような画面になります。

とりあえず何も設定せずに、先ほどのプロンプト例で示されていたものを入力してみます。

プロンプト

1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck

ネガティブプロンプト

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

以下の画像が生成されました。

プロンプトが忠実に再現されたとてもきれいな画像が生成されました。この絵の感じ好きな人多そうですね！

生成時間はおよそ1分ほどと、少し時間がかかっているようですが、Spaceで他の人とGPUを共有しているので仕方ないですね。ここからは、Animagine XL 2.0の機能をさらに検証していきます。

Animagine XL 2.0の機能をさらに検証してみた！

まずは先ほどとは違うもっと長いプロンプトを入力してみます。ネガティブプロンプトは固定です。

a girl with mesmerizing blue eyes peers at the viewer. Her long, white hair flows gracefully, adorned with stunning blue butterfly hair ornaments

変わらずプロンプト通りの綺麗で高画質な画像を生成してくれました。次に、このプロンプトをベースに、LoRAアダプターを使用して画像のスタイルを変更して生成させてみます。

LoRAアダプターを使用するには、Use LoRAにチェックを入れることでスタイルを選択可能です。

今回は、Pastel Style XL 2.0を使用してみます。以下の画像が生成されました。

プロンプトの再現度や画像の品質は変わらず、違うスタイルの画像が生成されました。

このように、ボタン一つでスタイルを変更できるので、とても柔軟にユーザーの生成したいアニメ画像を生成できるツールであることがわかりますね！

もう一点、画像のスタイルを変更できる方法として、Advanced Settingsを設定する手法があります。

こちらでは、より多くのスタイルを選択でき、画像のサイズやSamplerの変更も可能です。試しに、Style Presetを変化が分かりやすいPixel artに変更してみます。

ちゃんとピクセルアートスタイルで生成されました。ここまでの完成度で生成してくれるので、本当に色々な場面で使えそうですね！

これまで検証してきたように、Animagine XL 2.0はこれまでのアニメ画像生成モデルより生成画像のスタイルの柔軟性が高く、プロンプトの再現度や画像の品質も向上しています。このモデルを使用すれば、自分の理想のアニメ画像を生成することができるでしょう！

もし気になった方は、是非試してみてください。

なお、テキストプロンプトからアニメーションを生成するフレームワークについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【AnimateDiff】Stable Diffusionで作った美女を動かせる神AIツール

Animagine XL 2.0でアニメ画像を生成しよう！

Animagine XL 2.0は、高解像度で詳細なアニメ画像を生成するために設計された先進的な潜在テキストから画像への拡散モデルです。

このモデルは、Stable Diffusion XL 1.0をベースに、高品質のアニメスタイル画像データセットを使用して追加学習されており、プロンプトを忠実に再現した高品質のアニメ画像を生成してくれます。また、Animagine XL 2.0は商用利用可能で無料です。

実際に使ってみた感想は、超高精細な画像を生成できるだけでなく、自分の好みのスタイルの画像を生成できるような設定項目が数多くあり、誰でも簡単に理想のアニメ画像が生成できるツールでした。

このようなAIの進化により、ドラえもんの道具のような機能を持ったツールが世の中に溢れていくかもしれませんね。

最後に

いかがだったでしょうか？

GPT-3.5 Turboの最新アップデートで、より高速かつ低コストでのAI活用が可能になりました。自社での導入・活用を検討する際に、最適なモデル選定や活用方法について、一緒に考えてみませんか？

弊社では

・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発

などの開発実績がございます。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ