Stable Diffusion 3.5のプロンプトガイド通りに画像生成してみた!使い方&コツを徹底解説

Stable Diffusion 3.5 プロンプトガイド 使い方 コツ

画像生成AIを試してみたけど、思った通りの画像ができなくて悩んだことはありませんか?

最新モデルStable Diffusion 3.5の「プロンプトガイド」を活用すれば、思い描いたイメージを高精度に再現できます!
プロンプト次第でリアルな写真風、ファンタジーイラスト、さらには芸術作品風の画像も自在に作成可能です。

押さえておきたいポイント
  • プロンプトの基本構成と使い方を解説
  • スタイルや構図、照明設定など、生成画像の精度を高めるコツ
  • ネガティブプロンプトで不要な要素を排除する方法

この記事では、公式プロンプトガイドの内容を元に、画像生成のポイントや実例を紹介します。Stable Diffusion 3.5で理想の画像を作る方法を学びましょう!

ぜひ最後までご覧ください!

目次

Stable Diffusion 3.5とは?

Stable Diffusion 3.5は、Stability AIが開発した最新の画像生成AIモデルです。

このモデルは、前バージョンであるStable Diffusion 3からのフィードバックを基に改良され、2024年10月にリリースされました。

特徴
  • 高いカスタマイズ性:ユーザーが自身のニーズに合わせてモデルを簡単にファインチューニングでき、カスタマイズされたワークフローに基づくアプリケーションの構築が可能です。
  • 効率的なパフォーマンス:特にStable Diffusion 3.5 MediumやStable Diffusion 3.5 Large Turboモデルは、一般的な消費者向けハードウェアで高負荷をかけずに実行できるよう最適化されています。
  • 多様なスタイルと出力:3D、写真、絵画、線画など、幅広いスタイルの画像を生成でき、特定の指示がなくても多様な出力が得られます

Stable Diffusion 3.5には、以下のモデルが含まれています。

モデルのバリエーション
  • Stable Diffusion 3.5 Large:80億のパラメータを持ち、優れた品質と迅速な適合性を備えています。1メガピクセルの解像度でのプロフェッショナルな使用事例に最適です。
  • Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Largeの蒸留版で、わずか4ステップで高品質な画像を生成し、優れた即時適合性を実現します。
  • Stable Diffusion 3.5 Medium:26億のパラメータを持ち、改良されたアーキテクチャとトレーニング方法により、カスタマイズのしやすさと画質を両立させています。0.25~2メガピクセルの解像度の画像を生成できます。

Stable Diffusion 3.5では、プロンプトの解釈力生成精度が大幅に向上し、特にクロスアテンション機能の改良により、テキストの細かなニュアンスを正確に画像に反映できるようになりました。

さらに、新しいノイズ抑制技術により、生成画像のディテールや構図が鮮明で自然な仕上がりになったということ。トレーニングデータセットの拡充も行われ、多様な文化やスタイルに対応可能です。

これらの改良により、複雑な構図や具体的な指示を含むプロンプトでも、期待通りの結果を得ることができます

多彩なモデルバリエーションや高いカスタマイズ性、効率性を備えたStable Diffusion 3.5は、初心者からプロフェッショナルまで、幅広いユーザーのニーズに応える万能な画像生成ツールだと言えるでしょう。

ここからはStable Diffusion 3.5の使い方を解説します!

なお、Stable Diffusion 3.5の詳細について詳しく知りたい方は、下記の記事を合わせてご確認ください。

Stable Diffusion 3.5の使い方

ここでは、Stable Diffusion 3.5の以下の代表的な3つの使い方について簡単に解説します。

  • Webブラウザ版で使う方法
  • ローカルで使う方法
  • APIで使う方法

それぞれの方法には特徴があり、目的や環境に応じて最適な使い方を選ぶことができます。

早速見ていきましょう!

Webブラウザで使う方法

Webブラウザでは、特別なセットアップを必要とせず、手軽にStable Diffusion 3.5を利用できます。

以下のようなサービスが利用できます。

  • Hugging Face Spaces
  • Stable Diffusion 3.5 Large Online

Hugging Face Spacesでは、Stability AIの公式Spaceが公開されており、以下のリンクにアクセスするだけで利用できます。

stable-diffusion-3.5-medium
stable-diffusion-3.5-large
stable-diffusion-3.5-large-turbo

また、Stable Diffusion 3.5 Large Onlineでは、ログインなしでStable Diffusion 3.5 Largeが利用できますが、ログインすることで、より多くの機能を無料で使えます。

Stable Diffusion 3.5 Large Online

ローカルで使う方法

ここでは、Stable Diffusion 3.5をローカルで使う方法について簡単に紹介します。

現在、ローカル環境でStable Diffusion 3.5を使用する場合は、Comfy UIを利用することが推奨されており、公式Githubからダウンロードできます。

ダウンロード後、フォルダを解凍して任意の場所に配置して、以下の場所に使用したいモデルを配置します。

ComfyUI\models\checkpoints

Stable Diffusion 3.5を使用するためのワークフローComfy UI公式から公開されており、リンク先に最初の画像をドラッグ&ドロップします。

このワークフロー内で、各種設定を行うと画像を生成できるようになります。

さらに、Stable Diffusion 3.5を動かすために必要なGPUについての情報も公開されており、Stable Diffusion 3.5 MediumであればVRAMが9.9GBあれば最大限の能力を引き出せるそうです。

しかし、Stable Diffusion 3.5 LargeおよびStable Diffusion 3.5 Large Turboについては、VRAMが24GB搭載されたGPU出ないと最大限能力を発揮できないようです。

Comfy UIの概要や詳しい使い方は、下記の記事を合わせてご確認ください。

APIで使う方法

Stable Diffusion 3.5は、Stability AI APIからも利用できます。

APIを利用する際は必ずAPIキーが必要になるので、以下のリンクから生成してください。

account/keys

その際に、クレジットの購入も行うようにしましょう。

ここからは、実際にAPIにリクエストを送信して画像を生成する方法を解説します。

まず以下のリンクにアクセスして、リクエストのサンプルコードをコピーして新たにファイルを作成しましょう。

Stable Diffusion 3.0 & 3.5

基本的にはサンプルコードのままで良いですが、authorizationのAPIキーは自分のものに変更し、追加でモデルの指定を行ってください。

例)

import requests

response = requests.post(
    f"https://api.stability.ai/v2beta/stable-image/generate/sd3",
    headers={
        "authorization": f"Bearer sk-YourAPIKEY",
        "accept": "image/*"
    },
    files={"none": ''},
    data={
        "prompt": "Lighthouse on a cliff overlooking the ocean",
        "output_format": "jpeg",
    },
    params = {
    "model" : "sd3.5-large"
}
)

if response.status_code == 200:
    with open("./lighthouse.jpeg", 'wb') as file:
        file.write(response.content)
else:
    raise Exception(str(response.json()))
curl -f -sS "https://api.stability.ai/v2beta/stable-image/generate/sd3" \
  -H "authorization: Bearer sk-YourAPIKEY" \
  -H "accept: image/*" \
  -F prompt="Lighthouse on a cliff overlooking the ocean" \
  -F output_format="jpeg" \
  -F model="sd3.5-large"
  -o "./lighthouse.jpeg"

これを実行することで、生成された画像が指定した場所に指定した形式で格納されます。

生成された画像はこちらです。

今回はプロンプトのみで画像を生成しましたが、もちろんネガティブプロンプトやシード値を設定して画像を生成することも可能です。

Stable Diffusion 3.5のプロンプトガイドの内容とは?

ここからは、公式から公開されているプロンプトガイドを紹介し、実際にガイドに従って画像を生成してみたいと思います。

stable-diffusion-3-5-prompt-guide

まずはプロンプトの基本構成から紹介します。

プロンプトの基本構成

プロンプトを効果的に作成するには、アイデアを自然言語で明確に表現することが重要です。

ここからは、効果的なプロンプトを構成する7つの要素について紹介し、実際に画像を生成してみたいと思います。

なお、使用するモデルはStable Diffusion 3.5 Largeです。

style(スタイル)

まず、生成したい画像の全体的な雰囲気やアートスタイルを指定します。例として、「油絵風」、「サイバーパンク」、「水彩画」などと指定しましょう。

それでは実際に紹介されている以下のプロンプトで画像を生成してみます。

Prompt:Black and white, line art drawing of a hanging garden in an alien world.

異世界の空中庭園を描いたモノクロの線画。

例通りの画像が生成されました。

subject and action(主題と動作)

生成する画像に主題がある場合は、まず主題の存在を強調し、その後に主題が行う動作を強調するようにプロンプ​​トを書くことで、より効果的になります。

例えば、「海辺を歩く女性」や「空を飛ぶドラゴン」などです。

こちらもプロンプト例で画像を生成してみましょう。

Prompt:Low-angle side shot of a cute robot cycling through Central Park with colorful shades on.

カラフルな色合いをまとったかわいいロボットがセントラルパークを走り抜ける様子をローアングルで横から撮影した写真。

composition and framing(構成とフレーミング)

画像内で被写体がどのように配置されるか、カメラの視点やアングルを指定しましょう。構図やフレーミングは、画像の視覚的なバランスとインパクトを左右します。

さまざまな視点やフレーミングを指定することで、異なる印象や感情を引き出すことができます。

たとえば以下のような指定が可能です。

  • クローズアップ」: 被写体を強調。
  • 広角ビュー」: 全体を広く見せる。
  • 鳥瞰図」: 上空からの視点。
  • 対角線構図」: 力強い動きを表現。

こちらもプロンプト例で画像を生成してみましょう。

Prompt:Cinematic photography, close up, a banana laying on a table, slanted shadows wash across it, soft, diffused lighting.

映画のような写真、クローズアップ、テーブルに置かれたバナナ、斜めに落ちる影、柔らかい拡散光。

非常にリアルで、画像の中心であるバナナが強調された画像が生成できました。

lighting and color(照明と色彩)

照明と色彩は、生成する画像の照明条件や全体的な色調を設定する要素です。照明は、画像の雰囲気や感情に直接影響を与えます。

例えば、柔らかな自然光、劇的な陰影、カラフルなネオンライトなど、照明の種類や強度を指定できます。

また、色彩に関しても、暖色系、寒色系、モノクロームなど、全体の色調を設定することで、特定のムードやスタイルを強調することが可能です。

こちらも実際にプロンプト例で画像を生成します。

Prompt:Wide shot of a couple dancing in an empty plaza at night, illuminated by backlighting from tall street lamps that cast a warm glow, dynamic lighting and dynamic shadows reflecting their graceful movement on the cobblestone ground.

夜の誰もいない広場で、高い街灯の逆光が温かい光を放ち、ダイナミックな照明と影が石畳に映し出される中、優雅に踊るカップルのワイドショット。

このように、照明や色彩を詳細に指定することで、生成画像とは思えないほどリアルで美しい画像が生成できます。

technical parameters(技術的パラメータ)

技術的パラメータは、映画用語を使用して望ましい視点とフレーミングを指示します。

このパラメータを指定することで、生成される画像の品質や形式を制御でき、以下のような映画用語を用いて、画像に特定の構成や視覚効果を反映させることができます。

  • 視点やフレーミング
    • 鳥瞰図」: 高い視点からの俯瞰的なショット。
    • クローズアップ」: 被写体に焦点を当てた詳細な構図。
    • 広角ショット」: シーン全体を広く撮影する構図。
    • クレーンショット」: 高さや角度を変化させながらの視点。
  • レンズ効果
    • 魚眼レンズ」: 曲線的な外観でユニークな視覚効果を生み出すための指定。

こちらも実際に生成してみましょう。

Prompt:Bird’s eye view, drone fly-over footage: cinematic photography: action scene, looking down at a police car with flashing red lights racing down a street.

鳥瞰図、ドローンによる空撮映像:映画のような写真:アクションシーン、赤色灯を点滅させて猛スピードで走るパトカーを見下ろす。

text(テキスト)

Stable Diffusion 3.5では、生成する画像にテキストを組み込むことができます。

画像内にテキストを含める場合、その内容、フォントスタイル、配置場所を明確に指定することで、意図したメッセージや情報を効果的に伝えることができます。

例えば、看板の文字、ポスターのキャッチコピー、商品ラベルのテキストなど、具体的な内容を指定することで、よりリアルな画像を生成できます。

こちらもプロンプト例を試してみましょう。

Prompt:We are inside a modern living room decorated in muted colors. A large bay window covers the wall, the view beyond is of a rocky coast and the ocean. The words “Your Next Vacation Awaits!” are written across the image in a large script font, drop shadow, glowing edges around the words.

私たちは、落ち着いた色調で装飾されたモダンなリビングルームの中にいます。大きな出窓が壁一面を覆い、その向こうには岩だらけの海岸と海が広がっています。「Your Next Vacation Awaits!」という文字が、大きな筆記体フォントで画像全体に書かれており、文字の周りにはドロップシャドウと光るエッジが施されています。

このように、非常に高精細な画像の中に指定した文章を組み込んで生成してくれます。

negative prompting(ネガティブプロンプト)

ネガティブプロンプトは、生成したくない要素や避けたいスタイルを明示的に指定する要素です。

メインプロンプトが全体的なイメージを形成するのに対し、ネガティブプロンプトは不要な要素やテクスチャ、色相などを除外してイメージを洗練させ、焦点を絞った洗練された結果を実現します。

ネガティブプロンプトを使用することで、生成される画像の品質や精度を向上させることが可能です。

例えば、「ノイズを含まない」、「背景をぼかさない」などの指定を行うことで、よりクリアで意図に沿った画像を得ることができます。

高品質で思い通りの画像を生成させるには、ネガティブプロンプトの設定が必須とも言えます。こちらもプロンプト例をもとに、ネガティブプロンプトありとなしの画像を生成します。

ネガティブプロンプトなし

Prompt:Magical realism photo portrait, soft morning light, 30-something brunette woman, #hipster fashion, candid, hip.

マジカルリアリズムの写真、ポートレート、柔らかな朝の光、30代前半のブルネットの女性、#ヒップスターファッション、自然体、ヒップ。

ネガティブプロンプトあり

Prompt:Magical realism photo portrait, soft morning light, 30-something brunette woman, #hipster fashion, candid, hip.

Negative Prompt:smooth, neon, 3D render.

今回に関しては、ネガティブプロンプトを設定しなくても自然な画像が生成され、設定を適用しても大きな変化は見られませんでした。

しかし、ネガティブプロンプトありの方は、屋外で自然光のもとでポートレート風な画像になっており、しっかりとネガティブプロンプトは反映されているようです。

Image Showcase

ここからは、これまでご紹介したプロンプトガイドをもとに、さまざまなスタイルのプロンプトと画像生成例を紹介します。

ここでも、使用するモデルはStable Diffusion 3.5 Largeです。

Text(テキスト)

先ほども紹介したように、Stable Diffusion 3.5では画像内にテキストを埋め込むことが可能です。

Prompt:The word “Stability” in a thick, blocky script surrounded by roots and vines against a solid white background. The scene is lit by flat light, creating a reflective scene with a minimal color palette. Quilling style.

「Stability」という文字が、太くブロック体で書かれ、根とつるに囲まれ、白い背景にしっかりと配置されている。シーンはフラットライトで照らされ、最小限の色パレットで反射的なシーンを作り出している。クイリングスタイル。

フォントや配置等も設定できるので、広告やポスターのデザイン、タイトルカードの作成などでも活用できます。

Photography(写真)

Stable Diffusion 3.5の能力を活かし、プロンプトを駆使することで現実的な写真を生成できます。

日常的なシーンから風景、人物、都市の夜景まで幅広いシチュエーションを生成可能です。

以下の例では、靴の商品写真のようなリアルな画像を生成しています。

Prompt:Wide shot of street running shoes in a Blue and white color combo in the foreground, showcasing sleek design and dynamic lines. Blurred urban backdrop of buildings, graffiti, and streetlights to emphasize movement and speed. Product Photography.

青と白のカラーコンビネーションのランニングシューズを前景に配置したワイドショット。洗練されたデザインとダイナミックなラインを強調している。背景には、ビル、落書き、街灯などの都会的な風景をぼかして配置し、動きとスピードを強調している。商品撮影。

Line Art(線画)

プロンプト次第では、漫画やイラストの下絵のようなシンプルなデザインを生成できます。

以下の例では、漫画のようなデザインを生成しています。

Prompt:Black and white coloring book page, simple rough 1960s cartoon black-and-white pen and ink line art, hand-drawn outline doodle of a smiling apple with a smiling worm sticking out of it on top of a stack of textbooks, overlay says “Back to School!” in a 1960s hand-written print.

白黒塗り絵のページ、シンプルなラフ画の1960年代の漫画の白黒ペン画、インク画の線画、教科書の山の上に描かれた、にっこり笑ったリンゴとそこからにょきっと顔を出したにっこり笑った虫の輪郭の手描き落書き、1960年代の手書き文字で「Back to School!(学校へ戻ろう!)」と書かれた重ね合わせ。

工夫次第では漫画も画像生成AIで書けてしまうようになるかもしれませんね!

3D Art(3Dアート)

Stable Diffusion 3.5では、立体的でリアルな3Dモデル風の画像も生成できます。

このスタイルは、ゲームや映画のプロトタイプ、詳細なモデルの作成時に活用できます。

Prompt:Stylistic, 3D render of a cute tiny robot sitting with a puppy on a couch, surrounded by colorful sticky notes.

カラフルな付箋に囲まれ、子犬と一緒にソファに座っているかわいい小さなロボットの3Dレンダリング画像。

Expressionist Art(表現主義的アート)

感情や主観を強調したスタイルで、鮮やかな色彩や歪んだ形状を用いて印象を強調することもできます。

見る人に感情やストーリーを伝えることを目的としたデザインや、個性的なポスターを作成する際に有効です。

Prompt:Expressionist painting from side-angle showing exaggerated flow and motion of a broom sweeping the floor. The motion of the broom creates dust that reminds us of the particles that create stars in the universe.

床を掃くほうきの誇張された動きと流れを示す、側面からの表現主義絵画。ほうきの動きによって舞い上がる埃は、宇宙で星々を創り出す粒子を思わせる。

Watercolor Paintings(水彩画)

柔らかく透明感のある色彩で描かれる水彩画風のスタイルもプロンプトで指示することで生成可能です。

Prompt:Watercolor painting of a calm lake reflecting the bright autumn colors of red, orange, and yellow trees lining the shore.

岸辺に並ぶ赤やオレンジ、黄色に色づいた木々の鮮やかな秋の色を映し出す、穏やかな湖の水彩画。

こちらのスタイルは、自然や静物、感傷的なシーンを描写するのに最適です。

Digital Illustrations(デジタルイラスト)

デジタルイラストは、鮮明でシャープな線や豊かな色彩を特徴とし、物語性や個性を強調したビジュアルを作成できるスタイルです。

このようなスタイルもStable Diffusion 3.5では生成できます。

Prompt:Anime rendering of a quiet, rural train station during a rain shower, with reflections on the wet pavement. Umbrellas dot the scene as the rain creates ripples in nearby puddles, and a train waits in the background.

雨の降る中、静かな田舎の鉄道駅を描いたアニメーション。濡れた舗道の反射。雨が近くの水たまりに波紋を作り、傘が点在する様子と、背景に電車が待っている様子。

このスタイルは、ファンタジーアート、キャラクターデザイン、ポスター、広告、表紙アートなど、多岐にわたる分野で活用できます。

Voxel Art(ボクセルアート)

ボクセルアートは、立方体(ボクセル)を用いて構成されたデジタルアートスタイルで、レトロなビデオゲームやピクセルアートの3D版としてよく知られています。

シンプルでありながら独特の個性を持つスタイルで、Stable Diffusion 3.5を活用することで手軽に高品質な作品を生成できます。

Prompt:Wide view of a cute, isometric voxel cartoon 3D render of a vaporware apartment with a cat on a bed with starlight night view of the city from an open window in the background.

かわいいアイソメトリックボクセルアニメーションの3Dレンダリングによる、未発売の猫のいる蒸気アパートの広角ビュー。背景には、開いた窓から見える星明かりの夜景の都市。

Voxel Artスタイルは、カジュアルゲームやアニメーションのプロトタイプデザインとして活用可能で、それ以外にも多くの分野で利用できます。

このように、Stable Diffusion 3.5では漫画スタイルのような画像や、超リアルな写真のような画像まで、プロンプトで指示することでありとあらゆるスタイルの画像を生成できます。

皆さんも今回紹介したガイドや生成例を参考に、用途や目的に応じて、スタイルを組み合わせたり調整して画像を生成してみてください!

なお、誰でも簡単にアニメ美少女の画像を生成できるAnimagine XL 3.0について詳しく知りたい方は、下記の記事を合わせてご確認ください。

プロンプトガイドに従って画像を生成してみる

ここからは、Stable Diffusion 3.5の公式プロンプトガイドにもとづき、さまざまなスタイルを活用して至極の(高品質)画像を生成してみます。

今回生成するスタイルはこちらです。

  • 広告向けのデザイン
  • AI美少女のイラスト
  • モネ風の絵画

それぞれのスタイルで最適なプロンプトとネガティブプロンプトを設定し、その可能性を探ります。

早速やっていきましょう!

広告向けのビジュアルデザイン

広告やプロモーション向けのデザインでは、明確なメッセージ性と視覚的なインパクトが求められます。

この例では、未来的なテクノロジー企業を想定し、「革新」と「未来感」を強調しつつ、具体的な製品要素(スマートウォッチ)を広告の中心に据えることで、視覚的に訴求力のあるデザインを目指しています。

それでは実際にプロンプトを与えて画像を生成してみましょう。

プロンプト

Prompt:A futuristic, sleek digital poster for a technology brand, featuring glowing neon typography that says ‘Innovate Now!’, a dynamic abstract background with gradient blue and purple hues, and a minimalistic logo at the bottom right corner.

ネガティブプロンプト

Prompt:low quality, blurry, overexposed, pixelated, excessive text, crowded layout, outdated design.

結果はこのようになりました。

未来感やテクノロジー感が前面に出ており、かつ製品が中心に置かれ、見る人の目を自然に引きつけるようになっています。

おおよそ想定した通りになっていますが、Innovate Now!の文字がぼやけ、一部が隠れてしまっていたり、色彩が単調すぎる点が気になりました。

ビジュアルデザインとしての完成度は高いですが、さらにプロンプトを微調整したりコンセプトに修正を加えることでより効果的なイメージになると思います。

アニメスタイルAI美少女イラスト

アニメスタイルのAI美少女イラストは、画像生成AIでよく生成されるジャンルです。

ここでは、高品質な美少女イラストを目指し、細部にまでこだわったプロンプトでイラストを生成させます。

具体的には、輝く金髪や鮮やかな紫の瞳、繊細な装飾の衣装を特徴とする美少女という設定で、背景には滝や星空が広がる幻想的な世界を設定し、ドラマチックな雰囲気を演出しています。

また、ネガティブプロンプトではくすんだ色やぎこちないポーズなどを指定し、それらが画像に反映されないようにしています。

プロンプト

Prompt:A hyper-detailed anime-style portrait of a stunningly beautiful girl with flowing golden hair, glowing violet eyes, and wearing an intricately designed gown with shimmering jewel accents. The background is a dramatic, dreamlike fantasy setting with cascading waterfalls, soft glowing lights, and a vivid, star-filled sky. Ultra-detailed lighting highlights her features and creates a radiant, ethereal atmosphere.

驚くほど美しい少女の超詳細なアニメスタイルの肖像画。流れるような金の髪、輝くような紫の瞳、きらめく宝石をアクセントにした複雑なデザインのガウンを身にまとっている。背景は、滝が流れ落ち、柔らかな光が輝き、星がきらめく空が鮮やかに広がる、ドラマチックで夢のようなファンタジーの世界。超詳細な照明が彼女の特徴を際立たせ、輝くような幽玄な雰囲気を醸し出している。

ネガティブプロンプト

Prompt:dull colors, flat lighting, poorly defined features, unrealistic anatomy, awkward poses, cluttered background, low resolution, blurry details.

くすんだ色、フラットな照明、はっきりしない特徴、非現実的な解剖学、ぎこちないポーズ、ごちゃごちゃした背景、低解像度、ぼやけたディテール。

結果はこのようになりました。

プロンプトの指示通りの高品質な美少女のイラストを生成してくれました。キャラクターと背景の調和が取れており、幻想的な世界に引き込むような雰囲気があります。

しかし、衣装の細部にちりばめられたキラキラや背景の主張が少し強いようにも感じます。

この辺の主張をもう少し抑えるようにプロンプトを工夫することで、よりバランスのいいイラストに仕上がるでしょう!

モネの代表作「印象、日の出」の再現

ここでは、印象派の代表的な画家であるモネの「印象、日の出」を忠実に再現したイラストを生成させてみます。

印象、日の出
引用元:https://irohani.art/study/16024/

プロンプトの作成にはChatGPTの力を借り、以下のポイントを意識しました。

  • 色彩と光の再現
    オレンジ色の太陽と青みがかった霧の対比が作品の特徴であるため、これを重点的に表現します。
  • ブラシストロークの表現
    モネ特有の柔らかく流れるような筆遣いを反映し、細部ではなく全体の雰囲気や光の移り変わりを捉えます。
  • 構図の忠実性
    港とボート、遠景の工業地帯を正確に配置し、モネのオリジナル作品のレイアウトを反映します。
  • 雰囲気と質感
    霧がかった静かな雰囲気を重視し、光と空気感を強調します。

ただ、「印象、日の出」は多くの複雑な要素が絡み合う絵であり、プロンプトのみでこれを正確に再現するのは非常に難易度が高そうです。

以下が実際に作成したプロンプトです。

プロンプト

Prompt:An impressionist painting in the style of Claude Monet, recreating the serene and misty harbor of Le Havre at sunrise. The scene depicts a calm body of water with soft ripples and two small boats in the foreground, partially obscured by a diffused morning mist. A soft, warm orange sun rises in the sky, casting subtle reflections on the water. The background features faint outlines of cranes and smokestacks, blending into the hazy blue-gray atmosphere. The brushstrokes are loose, fluid, and textured, capturing the ephemeral play of light and atmosphere in a subdued and tranquil mood.

クロード・モネ風の印象派の絵画で、日の出を迎えるル・アーヴルの静かで霧のかかった港を描いている。 前景には、拡散した朝霧に部分的に隠れた、穏やかな水面と柔らかなさざ波、そして2隻の小舟が描かれている。 空には柔らかな温かみのあるオレンジ色の太陽が昇り、水面に微妙な反射を投げかけている。 背景にはかすかにクレーンと煙突の輪郭が描かれ、霞んだ青みがかった灰色の空気に溶け込んでいる。筆のタッチは緩やかで、流動的で、質感があり、光と大気の儚い戯れを、落ち着きと静寂の雰囲気の中で捉えています。

ネガティブプロンプト

Prompt:harsh details, sharp edges, overly saturated colors, modern ships, busy compositions, photorealistic textures, excessive clarity, crowded scenes.

粗いディテール、鋭いエッジ、過度に彩度の高い色、現代の船、込み入った構図、写実的なテクスチャ、過剰な鮮明さ、混雑した場面。

結果はこのようになりました。

プロンプトの指示通りの絵にはなっているようですが、「印象、日の出」を正確に再現することはできませんでした。

この絵は、「印象、日の出」にインスパイアされた作品としてはまずまずな作品だと思いますが、忠実な再現という観点では大幅な改善の余地があります。

モネの特徴である「柔らかな筆使い」と「曖昧さの中にある光の表現」をさらに意識し、より抽象的でシンプルな絵になるようにプロンプトを工夫することで、完全再現に一歩近づくと感じました。

まとめ

Stable Diffusion 3.5は、広告デザインやキャラクターデザイン、芸術作品の再現など、幅広い用途で活用できる高性能な画像生成AIです。

この記事では、モデルの基本情報やWebブラウザ版、ローカル環境、APIといった使い方を解説するとともに、公式から公開されているプロンプトガイドのポイントや実際に生成してみた結果を紹介しました。

そのガイドに従い、スタイル、構図、ライティング、ネガティブプロンプトなどの要素を細かく設定することで、目的に合った画像を生成できることが確認できました。

また、実際に広告用のデザインやAI美少女イラスト、モネの「印象、日の出」の再現を行い、生成結果を分析しました。

Stable Diffusion 3.5は、プロンプト次第で無限の可能性を秘めている高性能な画像生成AIです。

本記事を参考に、独自のプロンプトを設計し、目的に沿った画像生成を行ってみてください!

最後に

いかがだったでしょうか?

画像生成AIを活用し、プロ級の画像を生成できるAIによって業務効率化を実現しましょう。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

まずは、無料相談にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
商用利用可能な画像生成AIレポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • 中田

    データサイエンス専攻の大学院生。大学では、生成系AIの拡散モデルを用いた音楽生成について研究。 趣味は作曲、サッカー、コーヒー。

  • URLをコピーしました!
  • URLをコピーしました!
目次