Stable Diffusionモデルとは?おすすめモデル10選!ダウンロード方法や使い方、著作権まで徹底解説
「Stable Diffusion」を使うと写真のようにリアルな画像や、高画質なアニメ調の画像を作れますが、これは使用するモデルによって異なることをご存知でしたか?
今回は、画像生成に大きく影響するstable diffusionのモデルに焦点を当てて、おすすめのモデル、ダウンロード方法、使用方法、さらに商用利用時の注意点について詳しくご紹介します。
この記事を最後までお読みいただければ、お好みの画像を自由に作れるようになるかもしれません。
ぜひ、最後までご覧ください!
Stable Diffusionとは
Stable Diffusionは、画像生成AIモデルの一つで、英国のStability AI社によって2022年8月22日に初めてリリースされました。
ユーザーが指示文(プロンプト)を入力するだけで、簡単に画像やイラストを作成できます。また、Stable Diffusionはオープンソースなので無料で利用できます。
Stable Diffusionにおけるモデルとは
Stable Diffusionにおける「モデル」とは、画像生成を行うために学習するデータセットやアルゴリズムの組み合わせのことです。
例えばアニメ風のイラストを生成するために特化したモデルを使用すれば、ユーザーは細かなスタイルや雰囲気を指定しなくても、自動的にアニメ系の高品質なイラストを生成できます。
また、Stable Diffusionでは異なるモデルを組み合わせることもできます。これは「マージ」と呼ばれる技術で、各モデルの強みと弱みを補完しあうことで、より高品質で個性的な画像の生成も可能です。
モデルのダウンロード方法
次にモデルのダウンロード方法についてです。Stable Diffusionのモデルは次の2つのサイトからダウンロードできます。
- Hugging Face
- CIVITAI
それぞれのダウンロード方法について解説します。
Hugging Faceからのダウンロード
1. Hugging Faceの公式サイトにアクセスし、画面上部のメニューから「Models」を選びます。
2. 画面左側にあるタブから「Text-to-Image」を選びます。
3.Stable Diffusionに対応するモデルの一覧が表示されます。
今回は、後ほど紹介するおすすめモデルの「yayoi_mix」を検索しました。
4.モデルをダウンロードする前に、「License」をクリックして利用規約や利用条件を確認しましょう。特に商用利用や著作権に関する規則に注意してください。
5.「Files and versions」をクリックし、「.ckpt」や「.safetensors」などのファイル形式を選び、ダウンロードします。
特に「safetensors」形式は安全性が高くおすすめです。
これで、Hugging Faceからのダウンロードは完了です。
CIVITAIからのダウンロード
1. CIVITAIの公式サイトにアクセスし、画面上部のメニューから「Models」を選びます。
2. モデルの一覧が表示されますので、好みのモデルを選んでください。
3.ダウンロードページが表示されますので、利用に関する制限事項の確認をしておきましょう。下の方にスクロールするとあるアイコンをクリックすると確認できます。
日本語に訳すと以下のとおりです。
このモデルは、ユーザーに以下のことを許可します:
- 作成者のクレジットを記載せずにモデルを使用する
- 自ら生成した画像を販売する
- お金を得るために、モデルを画像生成サービスで利用する
- Civitai上で利用する
- このモデルを使用したマージを共有する
- このモデルやこのモデルを使用したマージを販売する
- マージを共有する際に異なる権限を持つ
バツがついている箇所は禁止している行為です。この場合は「このモデルやこのモデルを使用したマージを販売する」ことや、「マージを共有する際に異なる権限を持つ」ことはやらないでください、ということになります。
4. 「Download」ボタンをクリックするとダウンロードが開始されます。この時、ボタンの右下に「SafeTensor」と表記されているものが安全性が高くおすすめです。
これで、CIVITAIからのダウンロードは完了です。
以上が、Stable Diffusionモデルのダウンロードに関する基本的な流れです。
「Hugging Face」と「CIVITAI」どちらのサイトを使うかは個人の好みによります。いずれにせよモデルの選択や使用時は、商用利用や著作権の問題がありますので、必ずライセンスや制限事項を確認するようにしてください。
モデルを使用する方法
続いて、モデルを使用する方法についてです。先ほどダウンロードしたモデルファイルを、Stable Diffusionがインストールされているフォルダに移動させます。
「stable-diffusion-webui」→「models」→「Stable-diffusion」と進み、その中に保存してください。これで、モデルが認識されて使えるようになります。
VAEとは?
VAE(Variational Autoencoder、変分オートエンコーダー)とは、深層学習の一つです。VAEを使うことで、生成する画像をより詳細でリアルなものにできます。特に、複雑なテクスチャや細かいディテールが必要な場合に重要な要素です。
Stable Diffusionで使えるおすすめモデル
Stable Diffusionのモデルの数は非常に多く、継続的に新しいモデルがリリースされています。その中でも今回は、特に注目すべき7つのモデルを選出し、それぞれの推奨VAE、商用利用の可否、得意とする分野について紹介します。
yayoi_mix
- 推奨VAE:なし
- 商用利用:一部可能
- 得意な分野:リアル系AI美女
「yayoi_mix」はリアル系AI美女の生成に特化したモデルです。アジア系の人物を生成するのに適しており、実写に近い画像を生成できるため、AI写真集などでの利用例が多いようです。
推奨VAEは特に指定されていませんので、一般的に使用される汎用VAE(例:vae-ft-mse-840000-ema-pruned)をおすすめします。
このモデルの利用にあたっては、暴力的な表現や児童ポルノ、未成年者の性的な表現などを禁止しています。また、実在する人物に似せた画像を生成し、本人の許可なく公開することも禁止のようです。
BRA V6
- 推奨VAE:なし
- 商用利用:一部可能
- 得意な分野:リアル系AI美女
「BRA V6」はリアル系のAI美女に特化しており、特にアジア人の特徴を持つリアルな人物の画像を生成するのに適しています。実写に近い画像が生成できるため、AI写真集などでの利用が多いです。
推奨VAEは特に指定されていませんので、汎用モデルの「vae-ft-mse-840000-ema-pruned」がおすすめです。商用利用は一部可能で、クリエイターのクレジットを入れずにモデルを使用したり、生成した画像を販売したりすることが認められています。
しかし、Civitaiでの利用やマージモデルの販売、お金を得るためにモデルを画像生成サービスで利用するのは禁止されています。
CityEdgeMix
- 推奨VAE:不要
- 商用利用:不可
- 得意な分野:フォトリアリスティック
「CityEdgeMix」は、フォトリアリスティックなアジア系の女性の画像生成に特化しています。このモデルは、エロティックな画像(NSFW)とセーフな画像(SFW)の両方を生成できます。
VAEはあらかじめ組み込まれているため、追加の設定は不要です。商用利用には制限があり、CityEdgeMixモデルを使って生成した画像を販売したり、画像を生成するサービスで利用することは禁止されています。
CIVITAIからのダウンロードはこちら
HimawariMix
- 推奨VAE:不要
- 商用利用:一部可能
- 得意な分野:フラットなアニメビジュアル
HimawariMixは、アニメスタイルの画像生成に特化しており、特にフラットなアニメビジュアルの生成に優れています。様々なモデルを組み合わせたことにより、背景や細部の表現力に強みを持っており、アニメアートワークの高品質な生成が可能です。
細部の表現力が高いVAEを内蔵しており、複雑な背景や細かいディテールの表現が可能です。
商用利用については一部可能で、生成した画像の販売を認めています。しかし、Civitaiでの利用やマージモデルの販売、お金を得るためにモデルを画像生成サービスで利用するのは禁止されています。
Anime Pastel Dream
- 推奨VAE:不要
- 商用利用:一部可能
- 得意な分野:パステル調のアニメイラスト
「Anime Pastel Dream」はパステル調のアートスタイルを好むユーザーや、アニメ風のイラストを生成するのに適しています。特に、アニメの女性キャラクターやマンガのコンセプトアートなどが得意です。
このモデルのVAEはあらかじめ組み込まれており、「Soft-baked vae」と「Hard-baked vae」と呼ばれる2種類のバージョンがあります。商用利用は可能ですが、マージモデルの販売は禁止されています。
MeinaUnreal
- 推奨VAE:なし
- 商用利用:一部可能
- 得意な分野:2.5D感のあるアニメイラスト
「MeinaUnreal」は、2.5D感のあるアニメイラストの生成を目標としており、詳細で洗練された画像を生成するのに適しています。
このモデルにおける推奨VAEは特に指定されていませんので、アニメスタイルに適したVAE(例:Anything-v3-Better-VAE)を使用するのが良いでしょう。
商用利用は一部可能で、生成した画像の販売が認められています。しかし、クリエイターのクレジットを入れずにモデルを使用することや、マージモデルの販売、お金を払って画像を生成するサービスでの利用は禁止されています。
blue_pencil
- 推奨VAE:ClearVAE
- 商用利用:可能
- 得意な分野:ハイクオリティなアニメイラスト
「blue_pencil」はアニメスタイルの女性キャラクターや動物などのイラスト特化しており、細かなディテールやかわいらしいスタイルの表現に適しています。
推奨VAEは「ClearVAE」です。画像の品質を最適化するためには、別途設定する必要があります。このモデルは商用利用が可能です。ユーザーはCreativeML Open RAIL-Mライセンスに基づき、倫理的かつ法的な責任を持ってモデルを使用してください。
Stable Cascade
- 推奨VAE:内蔵
- 商用利用:条件付きで可能
- 得意な分野:高品質な画像生成全般
Stable Cascadeは、従来のモデルとは一線を画す3段階の生成プロセスを採用し、驚くほど細やかな表現を可能にしたモデルです。
写真のような精密さから、芸術的な抽象的な表現まで、幅広い画像を生成できます。短い説明文から複雑な画像を作り出す能力が高く、プロのクリエイターからアマチュアまで、多くのユーザーに活用されています。
商用利用も条件付きで認められているので、ビジネスでの活用にもおすすめです。
- Stable Cascade-base モデルのダウンロードはこちら
- Stable Cascade-prior モデルのダウンロードはこちら
- Stable Cascade-controlnet モデルのダウンロードはこちら
Juggernaut XL
- 推奨VAE:内蔵
- 商用利用:条件付きで可能
- 得意な分野:多様なスタイルの高品質画像
Juggernaut XLは、画像生成の万能選手と呼べるモデルで、写真のようなリアルな画像から手描き風のイラストまで、幅広いスタイルが生成できます。
細かい部分まで丁寧に描き込む能力があり、複雑な構図やたくさんの要素が入った画像も得意としています。ユーザーの指示を正確に理解して、イメージ通りの画像を生み出してくれるので、クリエイティブな作業をする際に強力なツールとなること間違いありません。
- Juggernaut XLのダウンロードはこちら
DreamShaper
- 推奨VAE:内蔵
- 商用利用:条件付きで可能
- 得意な分野:創造的で夢のような画像
DreamShaperは、その名の通り、夢を形にするモデルです。
ぼんやりしたイメージを鮮明な画像として具現化することができ、現実世界には存在しないファンタジーな世界や未来的な風景を生成するのが得意です。
抽象的な概念や感情を色鮮やかな色彩と形で表現するなど、これまでにない斬新なアイデアで視覚化してくれます。
テキストで指示を出すだけで、素晴らしい画像が生まれるかもしれません。クリエイティブな画像を楽しみたい人にぴったりのモデルと言えるでしょう。
- DreamShaperのダウンロードはこちら
なお、AIインフルエンサーの作り方について詳しく知りたい方は、下記の記事を合わせてご確認ください。
ノウハウを一切隠さずに全て公開しているので、全く同じ手順であなたもAIインフルエンサーを作成することができます。AIインフルエンサーを自社で活用したい方におすすめの記事です。
続きを読む
Stable Diffusion 3.5の登場
2024年10月22日にStability AIから新たなモデル、Stable Diffusion 3.5がリリースされました。このモデルは、これまでの画像生成技術がさらに進化し、高品質な画像を生み出せるようになりました。
Stable Diffusion 3.5の特徴は、使いやすさと多様性です。複雑な指示を入力しなくても、さまざまな肌の色や特徴を持つ人物画像を簡単に作れます。3Dグラフィックス、写真のような画像、絵画風の作品、シンプルな線画まで、幅広いスタイルの画像を生成できるのが魅力です。
ユーザーのニーズに合わせて、Large、Large Turbo、Mediumという3つのバージョンが用意されています。高品質な画像を求める人はLarge、素早く結果を得たい人はLarge Turbo、バランスの取れた性能を求める人はMediumを選ぶと良いでしょう。
このモデルの登場により、クリエイターやデザイナーの作業効率が大幅に向上すると期待されています。
Stable Diffusionでモデルを使ってみた
おすすめモデルでも紹介したように、Stable Diffusionにはアニメ調のものからリアル調のものまで、様々なモデルがありますね。下の画像のプロンプトは同じですが、違うモデルを選択して生成したものです。
どうですか?
同じプロンプトを入力しても、モデルによって生成される画像がガラッと変わったのが分かりますね。さらに、モデルごとに推奨されるプロンプト/ネガティブプロンプトや設定があります。
例えば、先ほど使用したモデルのDivineEleganceMixには以下のような記述がありました。
プロンプトだけでなく、おすすめのサンプラーなど、詳細に書かれていますね。利用しているモデルのサンプルのような画像を生成したい場合は推奨の設定を反映させるようにしましょう。
Stable Diffusionの商用利用・著作権に関して
Stable DiffusionはCreative ML OpenRAIL-Mライセンスの下で運営されており、商用目的での使用が法的に許可されています。
Creative ML OpenRAIL-Mライセンスとは?
Creative ML OpenRAIL-Mライセンスは、Stable DiffusionのようなAIモデルに適用される特殊なライセンスです。モデルの使用者はライセンスに従い、倫理的かつ適法に使用する責任があります。
ただし、使用するモデルによっては商用利用を制限していることがありますので注意してください。
そこで、あらためてHugging FaceとCIVITAIでモデルのライセンスを確認する方法について説明します。
Hugging Faceのライセンス確認方法
Hugging Faceのライセンスは、下図の赤枠「creativeml-openrail-m」をクリックすると確認できます。
また、「Model Card」の本文中にも制限事項が記載されていたりしますので、併せて確認するようにしましょう。
CIVITAIのライセンス確認方法
CIVITAIのライセンスはモデルのページに記載されています。下図の赤枠内にライセンスの種類(大半のモデルは「creativeml-openrail-m」)と、それに加えて制限事項(アイコン)が記載されています。
さらに、アイコンをクリックするとその詳細を確認できます。
日本語に訳すと以下のとおりです。
このモデルは、ユーザーに以下のことを許可します:
- 作成者のクレジットを記載せずにモデルを使用する
- 自ら生成した画像を販売する
- お金を得るために、モデルを画像生成サービスで利用する
- Civitai上で利用する
- このモデルを使用したマージを共有する
- このモデルやこのモデルを使用したマージを販売する
- マージを共有する際に異なる権限を持つ
当然ですが、バツがついている箇所は禁止している行為です。
ちなみに、追加の制限事項が何もないモデルの場合は、アイコンの表示がありません。どちらのサイトからダウンロードするにしても、モデルを使用する前には必ずライセンスとその制限事項を確認し、適切に遵守することを心がけてください。
\画像生成AIを商用利用する際はライセンスを確認しましょう/
Stable Diffusionのモデルを使いこなそう!
いかがでしたか?
今回はstable diffusionのモデルについて紹介しました。記事の内容をまとめると、以下のとおりです。
モデルの概要
stable diffusionに入れることで、リアル調やアニメ調など、特定のスタイルの画像生成を行えるようになります。
モデルをダウンロードできるサイト
- Hugging Face
- CIVITAI
おすすめのモデル
- yayoi_mix
- BRA V6
- CityEdgeMix
- Anime Pastel Dream
- MeinaUnreal
- blue_pencil
Stable Diffusionは、プロンプトを入力するだけで、簡単に画像やイラストを作成できる画像生成AIです。無料でアクセスでき、様々なスタイルのモデルがあって楽しいのですが、ライセンスや制限事項はよく確認して使いましょう。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
「Stable Diffusion」のモデル選択は、生成画像の品質を大きく左右します。最適なモデルの活用で制作の幅を広げてくれます。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。