Stable Diffusion Web UIとは?使い方やダウンロード方法を徹底解説

Stable Diffusion Web UI 使い方 ダウンロード方法

WEELメディアリサーチャーのいつきです。

みなさんは、Stable DiffusionをWebブラウザ上で手軽に利用できる「Stable Diffusion Web UI」をご存知でしょうか?

画像生成の自由度が高いのはもちろん、無料で利用できるのがなによりの利点です。

押さえておきたいポイント
  • Stability AIが開発した画像生成AI「Stable Diffusion」を、Webブラウザ上で手軽に利用できるアプリ。
  • オープンソースで無料利用可能。商用利用も条件付きでOK。
  • オフラインでも利用できるためセキュリティ面で安心。

今回は、Stable Diffusion Web UIの概要や導入方法、使い方などを詳しく解説していきます。

最後まで目を通すと、自身のPCで手軽にAI画像生成ができるようになるので、クリエイティブな仕事が捗ること間違いありません。

ぜひ最後までご覧ください。

目次

Stable Diffusionとは

Stable Diffusionとは、Stability AIが開発した画像生成AIです。訓練済みのAIモデル「Diffusion Model」を搭載しており、日本語プロンプトに対する高い理解力を備えています。

Stable Diffusionは、画像生成AIの代表モデルともいえる生成AIで、テキスト入力から手軽に画像を生成できるのが特徴。image to imageにも対応しているので、参照画像をもとに新たな画像を生成することも可能です。

また、Stable Diffusionはオープンソースで公開されているので、無料でも利用できるのが魅力。生成した画像の所有権は基本的にユーザーにあるので、一部の学習モデルを除けば商用利用も認められています

なお、Stable Diffusionについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

Stable Diffusion Web UIとは

Stable Diffusion Web UIとは、Webブラウザを通して、無料でStable Diffusionを利用できるアプリです。その名の通り、Web UIによる手軽な操作性が魅力で、プログラミングなどの複雑な工程は発生しません。

そのため、初心者でも比較的簡単に画像生成を始められます。ローカル環境にインストールして使用するため、インターネット接続が不要であり、プライバシーを確保しながら高品質な画像を作成できる点も特徴です。

また、拡張機能を追加することで、より高度なカスタマイズや表現の幅を広げられます。

AUTOMATIC1111版とForge版の違い

項目AUTOMATIC1111版Forge版
リリース時期早い(開発が長く続いている)比較的新しい
動作の安定性安定性が高く、動作実績が豊富一部の環境では安定性に課題あり
拡張機能の対応多くの拡張機能が利用可能一部未対応の拡張機能あり
VRAM使用量多め(高性能なGPU推奨)少なめ(VRAM 4GBでも動作可能)
動作速度標準的VRAMの最適化により高速
ドキュメントの豊富さ公式・非公式の情報が充実情報が少なく、AUTOMATIC1111版の知識が必要になることも
おすすめの用途多機能を活用した高度な画像生成軽量PCやVRAMの少ない環境向け

Stable Diffusion Web UIには、AUTOMATIC1111版とForge版の2種類が存在します。AUTOMATIC1111版はForge版よりも前からリリースされているのが特徴で、ドキュメントの豊富さと安定した動作が魅力です。

長年の開発により、数多くの拡張機能やカスタマイズオプションが提供されており、多様な用途に対応できます。

一方、Forge版はVRAMを節約しながら高速に画像生成ができるため、スペックの低いPCでも動作しやすいのが強みです。とくに、VRAMが8GB以下の環境では顕著なパフォーマンス向上が期待できます。

AUTOMATIC1111版とほぼ同じUIで利用できるため、操作に戸惑うことはありません。また、Forge版では特定のアルゴリズムの最適化により、より効率的な画像生成が可能になっています。

Stable Diffusion Web UIを利用するメリット

Stable Diffusion Web UIを利用するメリットは、以下の3つです。

  • 無料で利用できる
  • カスタマイズが可能
  • オフラインでも利用可能

とくに、高品質な画像を無料で生成できるのが大きな魅力です。

以下で、それぞれのメリットを紹介していくので、ぜひ参考にしてみてください。

無料で利用できる

Stable Diffusion Web UIは、オープンソースで公開されているので、誰でも無料で利用できます。どこかのサイトに会員登録をする必要もありません。

ほかの画像生成を利用する際は、月額もしくは従量課金で費用を請求されることが多いので、これは大きなメリットですね!

生成した画像は、基本的に商用利用もできます

カスタマイズが可能

Stable Diffusion Web UIでは、拡張機能を利用して生成画像をカスタマイズできますLoraやControlNetといった、コミュニティによって開発されたさまざまな拡張機能を利用可能です。

たとえば、Loraを使用すると、アニメ風の画像やリアルな人間の画像など、特定のタスクに特化させられます。ニーズに沿った質の高い画像生成ができるようになるので、ぜひ試してみてください。

オフラインでも利用可能

Stable Diffusion Web UIは、オフラインでも利用できます。インターネット接続なしで作業がローカル上で完結するため、セキュリティ面での懸念を払拭できるのがメリットです。

ただし、PCのCPUやGPUのスペックによっては快適に動作しない場合があるため、スペック要件を事前に確認しておくと安心です。

Stable Diffusion Web UIのダウンロード手順

ここからは、Stable Diffusion Web UIの導入方法をご紹介します。WindowsやMacなどのOS別に、AUTOMATIC1111版のダウンロード手順を解説するので参考にしてみてください。

Windowsのダウンロード手順

必要スペック

  • CPU:6コア以上(Core i5~Core i7、Ryzen 5~7)
  • メモリ(RAM):最低16GB 推奨32GB以上
  • GPUメモリ(VRAM): 最低8GB 推奨16GB以上(RTX 30シリーズ以降)
  • ストレージ(SSD):512GB以上
  • OS:Windows(64bit)

WindowでStable Diffusion Web UIをダウンロードする際は、おもに以下3つのステップに沿って実施します。

  1. Pythonのダウンロード
  2. gitのダウンロード
  3. Stable Diffusion Web UIのダウンロード

まずは、Pythonとgitをダウンロードするために、自身が使っているWindowsのビット数を確認します。

デスクトップでWindowsキー+Xキーを押して、上から4つ目にある「システム」をクリックしてください。

デバイス仕様の「システムの種類」を確認すれば、ビット数がわかります。

次はPython公式サイトにアクセスして、Python 3.10.6のインストーラーをダウンロードします。

上記赤枠部分のどちらかビット数が自身のPCと一致するものをダウンロードしてください。

ダウンロードしたインストーラーを開きます。

「Add Python 3.10 to PATH」にチェックを入れて、「Install Now」をクリックしてください。

以下の画面が表示されたら、Pythonのダウンロードは完了です。

次は、gitの公式サイトにアクセスして、gitのインストーラーをダウンロードします。

Python同様、自身のPCのビット数と一致するものをダウンロードしてください。

ダウンロード後は、gitのインストーラーを開きます。

gitのインストーラーを立ち上げると、いくつかの項目が立て続けに表示されますが、すべて何もいじらずに「Next」をクリックしてください。

以下の画面が表示されれば、gitのダウンロードは完了です。

次は、Stable Diffusion WebUI関連のファイルを格納する任意のフォルダを開きます。

右クリックして、「Open Git Bash here」をクリックしてターミナルを開きましょう。

右クリックしても「Open Git Bash here」が見つからない場合は、「その他のオプションを確認」を押すと出てきます。

ターミナルを開いたら、以下のコマンドを入力します。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

コマンドを入力すると、Stable Diffusion Web UIがローカル環境にダウンロードされ、以下画面のファイルが作成されます。

上記ファイルを開き、「webui-user.bat」もしくは「webui-user」と表示されているWindowsパッチファイルを開きます。

ファイルを開いてしばらくすると、ターミナルに「Running on local URL: http://127.0.0.1:7860」が表示されて、自動的にWebブラウザ上でStable Diffusion Web UIが立ち上がります。

Macのダウンロード手順

必要スペック

  • CPU:6コア以上( M1チップ以上)
  • メモリ(RAM):最低16GB 推奨32GB以上
  • GPUメモリ(VRAM): M1チップ以上
  • ストレージ(SSD):512GB以上
  • OS:macOS

まずは、アプリ一覧から「ターミナル」を開いて、「Homebrew」をインストールします。

「Homebrew」をインストールする際は、以下のコードをターミナルにコピペしてください。

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

パスワードの入力を求められるので、いつもMacを開くときに使用しているパスワードを入力します。

パスワードの入力後はenterを押して、Homebrewのインストールが終わるのを待ってください。

次はターミナルに以下のコマンドを入れます。

export PATH="$PATH:/opt/homebrew/bin/"

以下のコマンドを入力して、インストールが完了していることやPATHが通っているか確認しましょう。

brew --version

以下の画像のような画面になればOKです。

筆者も直面しましたが、Homebrewのインストール中に「zsh: command not found: brew」と表示されてエラーになることがあります。

その際は、ファインダーから「ターミナル」を検索して、右クリックで「情報を見る」を選択します。その後、「Rosettaを使用して開く」にチェックを入れて、PCを再起動してからもう一度やり直してみてください。

今度はいよいよ、Stable Diffusion Web UIをダウンロードします。

以下のコマンドを入力して、必要なライブラリをインストールしてください。今回は、AUTOMATIC1111版をインストールしています。

brew install cmake protobuf rust python@3.10 git wget

インストール後の画面がこちらです。

続いて、以下のコマンドを入力して、Stable Diffusion Web UIのリポジトリをローカルPCにcloneしてください。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

今度は、以下のコマンドを実行して、いよいよStable Diffusion Web UIを起動します。

bash stable-diffusion-webui/webui.sh

正常に動作すると、以下画面のように「Running on local URL: http://127.0.0.1:7860」が表示されます。

この時点で、Stable Diffusion Web UIが自動でブラウザ上で立ち上がるので、実際に利用してみてください。

Google Colabのダウンロード手順

Google ColabでStable Diffusion Web UIをダウンロードする際は、有料版のGoogle Colab Proの契約が必要です。

無料版だとGoogle Colabの利用規約に引っ掛かり、Stable Diffusion Web UIのダウンロードや起動がうまくできません。

有料版を契約したうえで、Google Colabにアクセスして新しいファイルを立ち上げます。

その後、以下のコマンドを実行してShift+Enterを押してください。

!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
参考:https://colab.google/

これで、Google colabにAUTOMATIC1111/stable-diffusion-webuiのリポジトリを複製できました。

次は以下のコマンドを実行して、Stable Diffusion Web UIをダウンロードします。

%cd /content/stable-diffusion-webui

!python launch.py --share --enable-insecure-extension-access

コマンドの実行後に、[Running on public URL: https//xxxxx.gradio.live]が表示されれば完了です。

あとはリンクをクリックして、Stable Diffusion Web UIを起動しましょう。

Stable Diffusion Web UIの起動方法

Stable Diffusion Web UIを1度起動した場合、2回目以降の起動は簡単です。

まずは、PCのローカルフォルダで[stable-diffusion-webui]のファイルを検索してください。

その後、[stable-diffusion-webui]→[webui-user.bat]の順で開くと自動的にStable Diffusion Web UIが起動します。

Stable Diffusion Web UIの自動起動の設定をしていない場合は起動しないので、そのときは[webui-user.bat]をテキストエディットなどのメモで開いて「set COMMANDLINE」に「–autolaunch –xformers 」の書き込みを追加してください。

この手順で起動しない場合でも、ターミナル(Macの場合)で以下のコマンドを入力すれば、自動的にブラウザ上でStable Diffusion Web UIが起動します。

bash stable-diffusion-webui/webui.sh

Stable Diffusion Web UIを起動できない場合の対応策

Stable Diffusion Web UIの起動を試みた際に、何らかの影響でエラーになることもあります。

おもな理由は、PythonのバージョンがStable Diffusion Web UIが推奨している「python3.10.6」になっていないことが挙げられます。

この場合は、以下のコマンドを入力してください。

brew update
brew install pyenv

続けて、以下2つのコマンドを1つずつ入力していきます。

echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.zshrc
echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.zshrc
echo 'eval "$(pyenv init --path)"' >> ~/.zshrc
source ~/.zshrc

ここまでで、Pythonをインストールする準備が一通り整ったので、次は以下のコマンドを実行してください。

pyenv install 3.10.6

あとは、上記のPythonバージョンをシステムで使用できるように、以下のコマンドを実行します。

pyenv global 3.10.6

以下のコードを実行すれば、現在反映されているPythonのバージョンを確認できます。

python --version

この時点で、「python3.10.6」が指定されていれば成功なので、再度以下のコードを実行してStable Diffusion Web UIを起動してみてください。

bash stable-diffusion-webui/webui.sh

これでもまだエラーが出る場合は、ほかにも要因があるので、エラーメッセージをそのままChatGPTに入力して、原因や解決方法を聞いてみてください。

実際、筆者も何度もエラーが出たのですが、ChatGPTに聞いてその通りにコマンドを実行していったら、Stable Diffusion Web UIを起動できました。

筆者の場合は、指定されたPyTorchバージョン(torch=2.3.1)が現在の環境で利用できなかったので、対応するPyTorchを手動でインストールしています。

おそらく、色々なサイトで解決策を探すよりも楽に解決できるはずです。

今回はAUTOMATIC1111版のダウンロード手順を紹介しましたが、Forge版のダウンロード手順書気になる方は以下の記事をご覧ください。

Stable Diffusion Web UIの使い方

ここからは、Stable Diffusion Web UIの使い方を解説していきます。

基本操作から応用まで紹介しているので、ぜひ参考にしてみてください。

Web UIの基本操作(テキストから画像を生成)

まずは、Stable Diffusion Web UIの見方や基本となるtxt2img(テキストから画像を生成)のやり方を解説します。

テキストから画像を生成する際は、上記画像の①に注目してtxt2imgを選択します。その後は②の部分にプロンプトを入力して、必要ならその下にネガティブプロンプト(画像に反映させたくない要素)を入力して指定しましょう。

③では各種パラメータの調整ができます。

パラメータ意味
Sampling methodサンプリング手法。手法によって生成速度や画像の品質が変わる。
Sampling stepsサンプリングステップ数。値が大きいほど画像の品質が良くなるが、生成速度が落ちる。
Width、Height画像のサイズ。大きいほど画像の生成速度が遅くなる。
Batch Size生成する画像枚数。
Batch Count一度に生成する画像の何枚。
CFG Scaleプロンプトの影響の強さ。値が大きいほどプロンプトに忠実になるが、画像の品質が落ちることがある。

パラメータの調整後は、④の「Generate」を押して画像を生成しましょう。

img2imgの使い方(画像から画像を生成)

画像入力で画像を生成したい場合は、上部①のimg2imgを選択して、その下にプロンプトを入力します。

②で画像をアップロードして、その下にある各種パラメータを調整しましょう。最後に「Generate」ボタンを押せば画像生成が始まります。

生成した画像の保存方法

生成した画像は、画像の右横にあるダウンロードボタンを押すことで保存できます。ボタンを押すだけでダウンロードが始まるので、複雑な工程はありません。

生成した画像を気に入った場合は、忘れずに保存しましょう。

Stable Diffusion Web UIを使って画像を生成してみた

ここからは、実際にStable Diffusion Web UIを使って画像を生成してみます。

まずは、こちらのプロンプトを入力してみました。

東京のオフィス街を歩くスーツ姿の若い女性

プロンプトを入力したあとは、「Generate」を押して画像が生成されるのを待ちます。

実際に生成された画像がこちらです。

顔の部分が潰れてしまっていて、あまりいい画像とはいえませんね。

次は、同じプロンプトを英語で入れてみました。

顔が若干ぼやけているように見えますが、さっきよりはプロンプトの再現度が上がっています。

ちなみに、Stable Diffusion Web UIにはさまざまなパラーメーターがあるので、これらをいじると生成される画像の結果も変化します。

おもなパラメーターをまとめました。

  • Sampling method:ノイズの除去方法。変えると生成画像の結果にも影響が出る。
  • Width・Height:画像サイズの調整
  • Sampling steps:ノイズを除去する回数で、多いと高品質になるが生成時間が長くなる。20〜30程度がおすすめ。
  • CFG Scale:プロンプト従う影響度を調整できる。7〜12程度がおすすめ。
  • Hires.fix:使用すると画像が高解像度・高品質になる。
  • Batch count:1度に何枚の画像を生成するか指定できる。
  • Batch size:一度に大量の画像を生成するための機能。たとえば「2」に設定すると、Batch countの値×2倍の画像を生成できる。

上記のパラメーターのうち、「Hires. fix」にチェックを入れ、「CFG Scale」は10にしてみました。同じプロンプトで再度画像生成してみます。

実際に生成された画像が上記ですが、顔の部分以外は確かに質が向上しました。来ているスーツや背景の再現度が向上しているように感じます。

ただし、「Hires. fix」にチェックを入れた影響か、画像生成の時間もかなり長くなったので注意が必要です。

次は、アニメスタイルの画像生成をしてみます。

今回は以下のプロンプトを入れてみました。

Beautiful green-haired girl elf living in the forest, anime style.
(森に住む緑髪のエルフをアニメスタイルで)

生成された画像がこちらです。

ゲームに出てきそうなレベルのクオリティになりましたね!

このようにプロンプトやパラメーターをいじるだけで、生成される画像の質が大きく変わってくるので、自身で色々設定をいじりながら試してみてください。

Stable Diffusion Web UIを日本語化する方法

Stable Diffusion Web UIは、デフォルト設定で英語表記になっていますが、日本語化が可能です。日本語化する際は、以下の手順に従ってください。

  1. txt2imgの行の一番右にある[Extension]タブを開く
  2. [Available]タブを開く
  3. [localization]タブからチェックを外す
  4. [Load form]ボタンをクリックする

Stable Diffusion Web UIを日本語化する方法について詳しく知りたい方は、画像付きで解説している以下の記事を参考にしてみてください。

Stable Diffusion Web UIの拡張機能について

拡張機能の代表例としては、ControlNet・LoRA・Checkpointなどがあります。

  • ControlNet:画像のポーズや構図といった細かい要素を指定できる
  • LoRA:少ない計算量で特定の画風に寄せられる
  • Checkpoint:生成画像のスタイルを指定できる

それぞれの特徴や導入方法について詳しく知りたい方は、以下の記事も併せてご覧ください。

Stable Diffusion Web UIを利用する際の注意点

無料で高品質な画像を生成できるStable Diffusion Web UIですが、利用する際は以下の点に注意が必要です。

  • 導入するまでにハードルがある
  • 希望の画像を出すためにプロンプトに関する知識が必要

とくに、導入するまでにさまざまなコマンドを実行して必要なライブラリをインストールする必要があるので、ITに詳しくない方からするとかなりハードルは高いです。

以下で注意点を詳しく解説するので、ぜひ参考にしてみてください。

導入するまでにハードルがある

Stable Diffusion Web UIの導入方法で解説していますが、Stable Diffusion Web UIを導入する際は、いくつかのコマンドを入力して必要なライブラリなどをインストールする必要があります。

この作業が順調に進まず、エラーが出ることも多々あるので、ITに詳しくない人からするとかなりハードルが高いです。

ただ、すでにStable Diffusion Web UIの導入方法やエラーへの対応については、当記事の内容などを参照いただければ、おおよそは解決できます。

エラーの原因がわからない場合は、ChatGPTに聞くと意外とすぐに解決できることもあるので、ぜひ活用してみてください。

希望の画像を出すためにプロンプトに関する知識が必要

自分が希望する画像を出力するためには、プロンプトに関する知識が必要です。生成AIを初めて利用する方にとっては、難しいと感じるかもしれません。

ただ、現在は多くの人はStable Diffusion Web UIを利用しているので、インターネットで検索すれば、有効なプロンプトはすぐに調べられます

商用利用や著作権などのライセンスに注意する

Stable Diffusion Web UIで作成した画像は基本的に商用利用も可能です。ただし、他人のプライバシーを侵害する内容や人に危害を加えるような目的での使用は認められていません。

また、CivitaiやHugging Faceでモデルをダウンロードする際は、個別に商用利用の可否などが設定されているので、ダウンロード前に確認しておきましょう。

Stable Diffusion Web UIでよくある質問

Stable Diffusion Web UIでよくある質問をまとめました。

  • Stable Diffusion Web UIでおすすめのプロンプトは?
  • Stable Diffusion Web UIのおすすめモデルは?
  • Stable Diffusion Web UIの「CFG Scale」とは?

以下でそれぞれの質問に回答していきます。

Stable Diffusion Web UIでおすすめのプロンプトは?

Stable Diffusion Web UIでは、「high resolution」といった画質を指定するプロンプト「manga style」といったスタイルを指定するプロンプトを入れるのがおすすめです。

また、高精度の画像を生成したいなら、優先順位の高い単語を前に持ってくる、重要な単語を「」で囲うといったテクニックも有効です。

おすすめのプロンプトについて詳しくは、以下の記事をご覧ください。

Stable Diffusion Web UIのおすすめモデルは?

「yayoi_mix」や「blue_pencil」がおすすめです。

「yayoi_mix」はリアルなAI美少女、「blue_pencil」はハイクオリティなアニメ風イラストが作れます。

なお、Stable Diffusionにおける「モデル」とは、画像生成を行うために学習するデータセットやアルゴリズムの組み合わせのことです。

おすすめモデル一覧や導入方法について詳しくは、以下の記事をご覧ください。

Stable Diffusion Web UIの「CFG Scale」とは?

「CFG Scale」とは、入力したプロンプトへの忠実度を設定するパラメータのことです。値が大きいほどプロンプトに忠実な画像が生成できますが、大きくしすぎると画像にノイズが入ります。

パラメータは、1〜30までありますが、基本的には15〜20あたりがおすすめです。

CFG Scaleについて比較検証した記事もあるので、ぜひご覧ください。

Stable Diffusion Web UIで画像を生成してみよう!

Stable Diffusion Web UIは、Webブラウザ上で手軽に画像を生成できる便利なアプリです。利用することで、以下のメリットを受けられます。

【Stable Diffusion Web UIを利用するメリット】

  • 無料で利用できる
  • カスタマイズが可能
  • オフラインでも利用可能

ただし、導入する際の工程が多く、ハードルは少々高めです。

本記事でも導入方法を画像付きで詳しく解説しているので、ぜひ参考にしてみてください。

最後に

いかがだったでしょうか?

「Stable Diffusion Web UI」は、自由度の高い画像生成を可能にし、クリエイティブな業務を効率化します。この技術をビジネスにどう活用できるか、可能性を模索してみてください。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

まずは、無料相談にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
商用利用可能な画像生成AIレポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • いつき

    高卒6年目にして独立開業した、フリーランスのWebライター。 ChatGPTをはじめ、多くのAIツールを使いこなした経験を基に、AIメディアの記事を執筆中。 複数のWebメディアに在籍し、ライター・ディレクター業務をマルチにこなす。

  • URLをコピーしました!
  • URLをコピーしました!
目次