【Stable Diffusion Web UI】初心者でも安心!導入方法や使いこなし術まで解説
WEELメディアリサーチャーのいつきです。
みなさんは、Stable DiffusionをWebブラウザ上で手軽に利用できる「Stable Diffusion Web UI」をご存知でしょうか?
画像生成の自由度が高いのはもちろん、無料で利用できるのがなによりの利点です。
- Stability AIが開発した画像生成AI「Stable Diffusion」を、Webブラウザ上で手軽に利用できるアプリ。
- オープンソースで無料利用可能。商用利用も条件付きでOK。
- オフラインでも利用できるためセキュリティ面で安心。
今回は、Stable Diffusion Web UIの概要や導入方法、使い方などを詳しく解説していきます。
最後まで目を通すと、自身のPCで手軽にAI画像生成ができるようになるので、クリエイティブな仕事が捗ること間違いありません。
ぜひ最後までご覧ください。
Stable Diffusionとは
Stable Diffusionとは、Stability AIが開発した画像生成AIです。訓練済のAIモデル「Diffusion Model」を搭載しており、日本語プロンプトに対する高い理解力を備えています。
Stable Diffusionは、画像生成AIの代表モデルともいえる生成AIで、テキスト入力から手軽に画像を生成できるのが特徴。image to imageにも対応しているので、参照画像をもとに新たな画像を生成することも可能です。
また、Stable Diffusionはオープンソースで公開されているので、無料でも利用できるのが魅力。生成した画像の所有権は基本的にユーザーにあるので、一部の学習モデルを除けば商用利用も認められています。
なお、Stable Diffusionについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
Stable Diffusion Web UIとは
Stable Diffusion Web UIとは、Webブラウザを通して、無料でStable Diffusionを利用できるアプリです。その名の通り、Web UIによる手軽な操作性が魅力で、プログラミングなどの複雑な工程は発生しません。
なお、Stable Diffusion Web UIには、AUTOMATIC1111版とForge版の2種類が存在します。AUTOMATIC1111版はForge版よりも前からリリースされているのが特徴で、ドキュメントの豊富さと安定した動作が魅力です。
一方、Forge版はVRAMを節約できるため、少ないVRAMやGPUメモリでも高速で画像生成ができます。AUTOMATIC1111版とほぼ同じUIで利用できるので、操作性も問題ありません。
Stable Diffusion Web UIを利用するメリット
Stable Diffusion Web UIを利用するメリットは、以下の3つです。
- 無料で利用できる
- カスタマイズが可能
- オフラインでも利用可能
とくに、高品質な画像を無料で生成できるのが大きな魅力です。
以下で、それぞれのメリットを紹介していくので、ぜひ参考にしてみてください。
無料で利用できる
Stable Diffusion Web UIは、オープンソースで公開されているので、誰でも無料で利用できます。どこかのサイトに会員登録をする必要もありません。
ほかの画像生成を利用する際は、月額もしくは従量課金で費用を請求されることが多いので、これは大きなメリットですね!
生成した画像は、基本的に商用利用もできます。
カスタマイズが可能
Stable Diffusion Web UIでは、拡張機能を利用して生成画像をカスタマイズできます。LoraやControlNetといった、コミュニティによって開発されたさまざまな拡張機能を利用可能です。
たとえば、Loraを使用すると、アニメ風の画像やリアルな人間の画像など、特定のタスクに特化させられます。ニーズに沿った質の高い画像生成ができるようになるので、ぜひ試してみてください。
オフラインでも利用可能
Stable Diffusion Web UIは、オフラインでも利用できます。インターネット接続なしで作業がローカル上で完結するため、セキュリティ面での懸念を払拭できるのがメリットです。
ただし、PCのCPUやGPUのスペックによっては快適に動作しない場合があるため、スペック要件を事前に確認しておくと安心です。
Stable Diffusion Web UIの導入方法
ここからは、Stable Diffusion Web UIの導入方法をご紹介します。筆者はMacを使用しているので、今回紹介するのはMac版の導入方法です。
まずは、アプリ一覧から「ターミナル」を開いて、「Homebrew」をインストールします。
「Homebrew」をインストールする際は、以下のコードをターミナルにコピペしてください。
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
パスワードの入力を求められるので、いつもMacを開くときに使用しているパスワードを入力します。
パスワードの入力後はenterを押して、Homebrewのインストールが終わるのを待ってください。
次はターミナルに以下のコマンドを入れます。
export PATH="$PATH:/opt/homebrew/bin/"
以下のコマンドを入力して、インストールが完了していることやPATHが通っているか確認しましょう。
brew --version
以下の画像のような画面になればOKです。
筆者も直面しましたが、Homebrewのインストール中に「zsh: command not found: brew」と表示されてエラーになることがあります。
その際は、ファインダーから「ターミナル」を検索して、右クリックで「情報を見る」を選択します。その後、「Rosettaを使用して開く」にチェックを入れて、PCを再起動してからもう一度やり直してみてください。
今度はいよいよ、Stable Diffusion Web UIをダウンロードします。
以下のコマンドを入力して、必要なライブラリをインストールしてください。今回は、AUTOMATIC1111版をインストールしています。
brew install cmake protobuf rust python@3.10 git wget
インストール後の画面がこちらです。
続いて、以下のコマンドを入力して、Stable Diffusion Web UIのリポジトリをローカルPCにcloneしてください。
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
今度は、以下のコマンドを実行して、いよいよStable Diffusion Web UIを起動します。
bash stable-diffusion-webui/webui.sh
正常に動作すると、以下画面のように「Running on local URL: http://127.0.0.1:7860」が表示されます。
この時点で、Stable Diffusion Web UIが自動でブラウザ上で立ち上がるので、実際に利用してみてください。
Stable Diffusion Web UIを起動できない場合の対応策
Stable Diffusion Web UIの起動を試みた際に、何らかの影響でエラーになることもあります。
おもな理由は、PythonのバージョンがStable Diffusion Web UIが推奨している「python3.10.6」になっていないことが挙げられます。
この場合は、以下のコマンドを入力してください。
brew update
brew install pyenv
続けて、以下2つのコマンドを1つずつ入力していきます。
echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.zshrc
echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.zshrc
echo 'eval "$(pyenv init --path)"' >> ~/.zshrc
source ~/.zshrc
ここまでで、Pythonをインストールする準備が一通り整ったので、次は以下のコマンドを実行してください。
pyenv install 3.10.6
あとは、上記のPythonバージョンをシステムで使用できるように、以下のコマンドを実行します。
pyenv global 3.10.6
以下のコードを実行すれば、現在反映されているPythonのバージョンを確認できます。
python --version
この時点で、「python3.10.6」が指定されていれば成功なので、再度以下のコードを実行してStable Diffusion Web UIを起動してみてください。
bash stable-diffusion-webui/webui.sh
これでもまだエラーが出る場合は、ほかにも要因があるので、エラーメッセージをそのままChatGPTに入力して、原因や解決方法を聞いてみてください。
実際、筆者も何度もエラーが出たのですが、ChatGPTに聞いてその通りにコマンドを実行していったら、Stable Diffusion Web UIを起動できました。
筆者の場合は、指定されたPyTorchバージョン(torch=2.3.1)が現在の環境で利用できなかったので、対応するPyTorchを手動でインストールしています。
おそらく、色々なサイトで解決策を探すよりも楽に解決できるはずです。
Stable Diffusion Web UIを使って画像を生成してみた
ここからは、実際にStable Diffusion Web UIを使って画像を生成してみます。
まずは、こちらのプロンプトを入力してみました。
東京のオフィス街を歩くスーツ姿の若い女性
プロンプトを入力したあとは、「Generate」を押して画像が生成されるのを待ちます。
実際に生成された画像がこちらです。
顔の部分が潰れてしまっていて、あまりいい画像とはいえませんね。
次は、同じプロンプトを英語で入れてみました。
顔が若干ぼやけているように見えますが、さっきよりはプロンプトの再現度が上がっています。
ちなみに、Stable Diffusion Web UIにはさまざまなパラーメーターがあるので、これらをいじると生成される画像の結果も変化します。
おもなパラメーターをまとめました。
- Sampling method:ノイズの除去方法。変えると生成画像の結果にも影響が出る。
- Width・Height:画像サイズの調整
- Sampling steps:ノイズを除去する回数で、多いと高品質になるが生成時間が長くなる。20〜30程度がおすすめ。
- CFG Scale:プロンプト従う影響度を調整できる。7〜12程度がおすすめ。
- Hires.fix:使用すると画像が高解像度・高品質になる。
- Batch count:1度に何枚の画像を生成するか指定できる。
- Batch size:一度に大量の画像を生成するための機能。たとえば「2」に設定すると、Batch countの値×2倍の画像を生成できる。
上記のパラメーターのうち、「Hires. fix」にチェックを入れ、「CFG Scale」は10にしてみました。同じプロンプトで再度画像生成してみます。
実際に生成された画像が上記ですが、顔の部分以外は確かに質が向上しました。来ているスーツや背景の再現度が向上しているように感じます。
ただし、「Hires. fix」にチェックを入れた影響か、画像生成の時間もかなり長くなったので注意が必要です。
次は、アニメスタイルの画像生成をしてみます。
今回は以下のプロンプトを入れてみました。
Beautiful green-haired girl elf living in the forest, anime style.
(森に住む緑髪のエルフをアニメスタイルで)
生成された画像がこちらです。
ゲームに出てきそうなレベルのクオリティになりましたね!
このようにプロンプトやパラメーターをいじるだけで、生成される画像の質が大きく変わってくるので、自身で色々設定をいじりながら試してみてください。
Stable Diffusion Web UIを利用する際の注意点
無料で高品質な画像を生成できるStable Diffusion Web UIですが、利用する際は以下の点に注意が必要です。
- 導入するまでにハードルがある
- 希望の画像を出すためにプロンプトに関する知識が必要
とくに、導入するまでにさまざまなコマンドを実行して必要なライブラリをインストールする必要があるので、ITに詳しくない方からするとかなりハードルは高いです。
以下で注意点を詳しく解説するので、ぜひ参考にしてみてください。
導入するまでにハードルがある
Stable Diffusion Web UIの導入方法で解説していますが、Stable Diffusion Web UIを導入する際は、いくつかのコマンドを入力して必要なライブラリなどをインストールする必要があります。
この作業が順調に進まず、エラーが出ることも多々あるので、ITに詳しくない人からするとかなりハードルが高いです。
ただ、すでにStable Diffusion Web UIの導入方法やエラーへの対応については、当記事の内容などを参照いただければ、おおよそは解決できます。
エラーの原因がわからない場合は、ChatGPTに聞くと意外とすぐに解決できることもあるので、ぜひ活用してみてください。
希望の画像を出すためにプロンプトに関する知識が必要
自分が希望する画像を出力するためには、プロンプトに関する知識が必要です。生成AIを初めて利用する方にとっては、難しいと感じるかもしれません。
ただ、現在は多くの人はStable Diffusion Web UIを利用しているので、インターネットで検索すれば、有効なプロンプトはすぐに調べられます。
Stable Diffusionのプロンプトガイドを知りたい方は、下記の記事を合わせてご確認ください。
Stable Diffusion Web UIで画像を生成してみよう!
Stable Diffusion Web UIは、Webブラウザ上で手軽に画像を生成できる便利なアプリです。利用することで、以下のメリットを受けられます。
【Stable Diffusion Web UIを利用するメリット】
- 無料で利用できる
- カスタマイズが可能
- オフラインでも利用可能
ただし、導入する際の工程が多く、ハードルは少々高めです。
本記事でも導入方法を画像付きで詳しく解説しているので、ぜひ参考にしてみてください。
最後に
いかがだったでしょうか?
「Stable Diffusion Web UI」は、自由度の高い画像生成を可能にし、クリエイティブな業務を効率化します。この技術をビジネスにどう活用できるか、可能性を模索してみてください。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。