DALL-E 3とは?使い方・日本語対応・プロンプトのコツまでやさしく解説

DALL·E3 chatgpt openai
押さえておきたいポイント
  • DALL-E 3はOpenAI開発の画像生成AI。2026年現在も利用可能だが、後継のChatGPT Images(GPT-Image-1.5)への移行が進行中
  • 詳細キャプション生成やCLIP活用により、入力のニュアンスを忠実に反映した高品質な表現力
  • ChatGPT・Copilot・Perplexityなど複数経路で利用可能。プラットフォームごとに商用利用条件が異なる点に注意

皆さんはDALL-E 3をご存じですか?

2023年9月21日にOpenAI社から発表された最新の画像生成AIで、ChatGPTを使って画像を生成することができるんです!従来のものから大幅に性能が向上しており、プロンプトのニュアンスを理解して入力に忠実な画像を生成してくれます。

なお、2026年現在もDALL-E 3はChatGPTやCopilotで引き続き利用可能ですが、OpenAIの画像生成はChatGPT Images(GPT-Image-1.5搭載)へと世代交代が進んでおり、DALL-E 3はAPI上ではPrevious generation(旧世代)扱いとなっています。

今回はDALL-E 3の概要や使い方、他の画像生成AIとの比較、APIからDALL-E 3を使う方法などを紹介していきます。ぜひ最後までご覧ください!

\生成AIを活用して業務プロセスを自動化/

目次

DALL-E 3とは

DALL-E 3は2023年9月21日にOpenAI社が公開した画像生成AIで、テキストプロンプトからその内容を反映した画像を生成するDALL-Eシリーズの第3世代モデルです。DALL-E3の読み方は(ダリ・スリー)です。名前の由来はサルバドール・ダリ(Salvador Dalí)とピクサーアニメ映画の「ウォーリー」(WALL-E)だというから驚きですね。

そんなDALL-E 3の特徴は以下の4つです。

  1. 理解力
    前のバージョンであるDALL・E2よりも、遥かに高いプロンプトのニュアンスや詳細を理解する能力を持っています。これにより、ユーザーのテキストプロンプトに正確に従った画像を簡単に生成できます。
  2. ChatGPTとの統合
    ChatGPT上でネイティブに構築されており、アイデアを提示すると、それをもとにアイデアを具体化する詳細な画像をChatGPTが自動的に生成します。
  3. 安全性
    暴力的、成人向け、または憎悪的なコンテンツを生成する能力は制限されており、フェイクニュースなどに悪用されないために、公人などの名前を含むリクエストを拒否するといった対策も進められています。
  4. クリエイティブコントロール
    DALL・E 3で生成されたものの所有権はユーザー側にありますが、著作権侵害対策として、存命しているアーティストのスタイルでの画像のリクエストを拒否するように設計されています。

さらに、クリエイターは、将来の画像生成モデルのトレーニングから自分の作品の仕様を拒否することができます。悪用されないための対策や、プロクリエイターの方を守るような対策を積極的に行っているようです。

DALL-E 3で使われている技術

DALL-E 3は短く抽象的なプロンプトでも、画像を生成することができます。

その背景には、より詳細で正確なキャプションを生成する専用のキャプショナーを用意し、トレーニングデータを再キャプションしたためです。ここからは、OpenAIが報告している論文を元に解説をします。

再キャプションには、次の3つの技術が使われています。

  • 詳細なキャプションの生成
  • CLIPモデルの利用
  • 生成されたキャプションと実データのバランス調整

詳細なキャプションの生成

まずは詳細なキャプションの生成についてです。

キャプショナーによって、画像の主題だけでなく背景や関連するオブジェクト、色彩、配置、テキストなども含む非常に詳細なキャプションが生成されます。これにより、抽象的なプロンプトでも関連するビジュアル情報が充実し、少ない情報からもイメージを生成する力が向上。

詳細なキャプションの生成に関しては、論文内ではアップサンプリングとしても説明しています。

アップサンプリングでは、キャプションの拡張、GPTモデルによる詳細化に触れており、実際にアップサンプリングされたキャプションを使うことで、DALL-E 3は通常のプロンプトよりも精度の高い画像生成ができることを確認しています。

DALLE3のアップサンプリングの説明
参考:https://cdn.openai.com/papers/dall-e-3.pdf

CLIPモデルの利用

次にCLIPモデルの利用です。

キャプショナーのトレーニングにはCLIP(Contrastive Language–Image Pretraining)を活用し、画像の内容を抽象的なテキスト情報に結びつける能力が向上。この結果、モデルは画像を生成する際に、キャプション内の細かなニュアンスも反映できるようになっています。​

DALLE3のキャプショナーのトレーニング
参考:https://cdn.openai.com/papers/dall-e-3.pdf

Figure4は元のキャプション、短い合成キャプション、詳細な合成キャプションでトレーニングされたモデルのCLIPスコアを比較したグラフです。

CLIPスコアは、テキストと画像の一致度を示す評価指標であり、図の結果から、詳細な合成キャプションを使用したモデルが最も高いCLIPスコアを達成しており、キャプションの詳細さが画像生成の精度に重要な役割を果たしていることが示されています。

DALLE3のCLIPスコア

さらにFigure5は、詳細な合成キャプションと元のキャプションの混合比率によるCLIPスコアの変化を示しています。

具体的には、80%、90%、95%の詳細な合成キャプションを含むデータセットでトレーニングされたモデルの性能を比較しました。この図より、合成キャプションの割合を増やすほどCLIPスコアが向上する傾向が見られ、詳細なキャプションがモデルの性能向上に寄与していることがわかります

生成されたキャプションと実データのバランス調整

最後が生成されたキャプションと実データのバランス調整。

モデルがキャプションの「偏り」から誤った出力を生成しないよう、キャプショナーで生成したキャプションと元のキャプションを混ぜ合わせる「ブレンド」を実施。これにより、モデルはリアルな人間が記述したキャプションのスタイルやフォーマットにも対応でき、短いプロンプトからでも自然な画像を生成することが可能になっています。

DALL·E 3と他の画像生成AIの違い

続いて、DALL·E 3と他の画像生成AIの性能を比較してみます。

DALL·E 3とDALL·E 2の違い

DALL-E 3には前モデルのDALL-E 2があります。どのように進化をしたのか比較を表にしました。

スクロールできます
比較項目DALL-E 2DALL-E 3
リリース時期2022年4月2023年10月
プロンプト理解力やや限定的(英語メイン)非常に高い(日本語も自然に対応
表現力・精度抽象的な指示が苦手複雑な構図や抽象的な表現も対応可能
文字(テキスト)入り画像苦手(崩れがち)かなり改善(看板やロゴ風も対応)
ChatGPTとの連携なしGPTと連携し、プロンプトの生成・編集が可能
部分修正対応ありChatGPT上で簡単に操作できるように進化
日本語対応一部可能/非推奨日本語プロンプトでも比較的扱いやすい
利用環境専用UI(ベータ)ChatGPT・Copilot経由で誰でも使いやすく
DALL·E 3とDALL·E 2の違い

DALL-E 3は、前バージョンのDALL-E 2と比べてプロンプトの理解力が大幅に向上し、日本語にも対応可能です。また、複雑な構図や文字入りの画像もより正確に表現でき、ChatGPTとの連携により初心者でも使いやすくなりました。

DALL·E 3とDALL·E 2で生成した画像の違い
クリックで表示

次に、DALL-E 2からどれほど進化したのか示す比較を見ていきましょう。

以下のプロンプトを入力し、出力された画像を比較します

An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.

プロンプト和訳

星雲の爆発として描かれたバスケットボール選手のダンクを表現した油絵

【DALL-E 2】

DALLE2が生成したダンクシュートを決める画像

【DALL-E 3】

DALLE3が生成したダンクシュートを決める画像

こう見るとディテールが全然違いますよね!どちらも正しくプロンプトを認識して画像を出力していますが、DALL-E 3は一つ一つの指定を忠実に高精細に表現しており、もはやアートのような感じです。

DALL-E 3とMidjourneyの違い

DALL-E 3とMidjourneyの違いを簡単にまとめると以下のようになります。

スクロールできます
比較項目DALL-E 3Midjourney
開発元OpenAIMidjourney社
操作方法ChatGPTやCopilotで対話的に使えるDiscord上でコマンド入力して使う
言語対応日本語OK(ChatGPT内でそのまま入力)基本は英語(日本語も可だが、工夫が必要)
プロンプトの書き方会話ベース・自然文でもOK英語ベースで具体的構造化が必要
文字(テキスト)入り画像△(文字表現は不安定)
部分修正◯(ChatGPT経由で可能)×(一部機能制限あり)
DALL-E 3とMidjourneyの違い

DALL-E 3は日本語に対応しており、思ったことをそのままプロンプトとして入力すれば簡単にイラストが生成できますが、商用利用はChatGPTに課金している場合のみ可能です。

一方Midjourneyは商用利用が可能なため、副業のイラストとして活用できますが、日本語でのプロンプトには対応していません。そのため、DALL-E 3に比べるとMidjourneyを使って画像生成をするハードルが若干高いかもしれません。

つまり、初心者にはDALL-E 3、よりクリエイティブに利用したい方にはMidjourneyが向いています。

さて、次はDALL-E 3の推しポイントである「入力のニュアンスを正確に理解できる」は本当なのかを検証します。

以下の抽象的な画像を生成するプロンプトを入力し、Midjourneyと比較します。

A mysterious landscape in a dream, painted in watercolor. Floating islands and stars fill the space.

プロンプト和訳

水彩画で描かれた、夢の中の不思議な風景。浮遊する島々と星々が空間を埋め尽くしている。

検証するポイントは、以下の5つです。

スクロールできます
検証項目内容
具体的な要素の確認画像に「浮遊する島々と星々」という具体的な要素が明確に表示されているか
スタイルの確認生成された画像が「水彩画」のスタイルであるか
テーマや雰囲気の照らし合わせ画像が「夢の中の不思議な風景」というテーマや雰囲気を適切に反映しているか
詳細な要素のチェックプロンプトに記された要素が全て画像に反映されているか
主観的な評価プロンプトに合致していると感じるか
検証内容

まずはDALL-E 3で作った画像がこちらです。

DALL-E 3で生成した水彩画で描かれた、夢の中の不思議な風景画像

類似の画像生成サービスであるMidjourneryで作った画像はこちらです。

DALL-E 3とMidjourneyの検証結果を比較表で整理しておきましょう。

スクロールできます
検証項目DALL-E 3Midjourney
具体的な要素の確認浮遊する島々・星々が鮮明に描写。雲の上に浮かぶ島や光を放つ星が明確島々・星々を描写。月光と緑豊かな樹木が特徴的
スタイルの確認水彩画特有の滲みと柔らかな色合いを表現。色の重なりやグラデーションが自然水彩画の色の流れや滲みあり。色彩の豊かさと繊細な光の表現
テーマ・雰囲気神秘的で幻想的。「夢の中の不思議な風景」を強く表現神秘的で静寂な雰囲気。夢のような空間を表現
詳細な要素プロンプトの要素(島・星・水彩画)をすべて反映プロンプトの要素を概ね反映
主観的な評価抽象的なプロンプトへの追従性が高い。夢想的な美しさが際立つ独自の美的表現が優れる。リアルな水彩質感は高評価
DALL-E 3とMidjourneyの画像生成精度比較(水彩画プロンプトでの検証)

総合的に、DALL-E 3はプロンプトの抽象的なニュアンス(「夢の中の不思議な風景」など)をより忠実に反映する傾向があり、Midjourneyは独自の美的センスで仕上げる傾向が見られました。

DALL-E3以外の画像生成AIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

DALL-E 3後継モデルとの比較

スクロールできます
比較項目DALL-E 3ChatGPT Images(GPT-Image-1.5)GPT-4o画像生成
主な利用環境ChatGPT・Copilot・APIChatGPTChatGPT
テキスト描画精度改善(DALL-E 2比)さらに向上中精度
編集・一貫性ChatGPT上で部分修正可能大幅に改善画像アップロードからの変換も可能
生成速度標準最大4倍高速化標準
API提供dall-e-3(deprecated扱い)gpt-image-1GPT-4oモデル経由
DALL-E 3と後継モデル(ChatGPT Images・GPT-4o)の比較

DALL-E 3は画像生成AIの基盤を築いたモデルですが、OpenAIはその後も進化を続け複数の後継モデルが登場しました。

まず、2025年にOpenAIが発表したChatGPT Imagesは、ChatGPT上での画像生成体験を大幅に進化させたモデルです。GPT-Image-1.5へアップデートされ、主に以下3つの強化が行われました。

  • 生成済み画像の部分修正・一貫性維持が大幅に改善
  • DALL-E 3と比べて最大4倍の高速化
  • 看板やロゴなど文字入り画像の精度がさらに向上

開発者向けには、DALL-E 3 APIの後継としてgpt-image-1が提供されています。新規で開発を進めていく場合は、こちらの採用が推奨されています。

そして、GPT-4oにも画像生成機能が統合されており、テキスト描画精度やプロンプト追従性がさらに向上しています。アップロード画像をベースにした変換・編集も可能です。

DALL-E 3の性能

ここからは、実際にDALL-E 3で生成された画像と、DALL・E2との比較を公式サイトや公式Xからの情報をもとに紹介していきます。

まず、生成された画像を紹介します。

プロンプト

A modern architectural building with large glass windows, situated on a cliff overlooking a serene ocean at sunset.

プロンプト和訳

夕暮れ時の穏やかな海を望む崖の上に建つ、大きなガラス窓を備えたモダンな建築の建物。

DALLE3が生成したモダンな建物

DALL-E 3はプロンプトの忠実な再現度が高く、抽象的な指示でも高品質な画像を出力できます。DALL-E 2と比べるとディテールの精度が大幅に向上しており、一つ一つの指定を高精細に表現してくれるのが特徴です。

では、ここからはDALL-E 3の使い方を見ていきましょう。

その他、DALL-E 3で生成した画像
クリックで表示

人間の心臓

An illustration of a human heart made of translucent glass, standing on a pedestal amidst a stormy sea.

Rays of sunlight pierce the clouds, illuminating the heart, revealing a tiny universe within.

The quote 'Find the universe within you' is etched in bold letters across the horizon.

プロンプト和訳

嵐の海で台座の上に立っている半透明のガラスでつくられた人間の心臓のイラスト。太陽光線が雲を突き抜けて心臓を照らし、その中に小さな宇宙が見える。水平線の向こう側には、『Find the universe within you 』という言葉が太い文字で刻まれている

DALLE3が生成した心臓の画像

こちらは、かなり詳細で複雑な指定をしていますが、こちらも忠実に再現されており、かつとても詳細で綺麗な画像が生成されています。DALL-E 3の認識能力の高さが伺えますね!

DALL-E 3の使い方

では、DALL-E 3を使う方法について解説します。

ChatGPT

DALL-E3はChatGPTで利用が可能ですが、無料プランでは制限はありますので画像をたくさん生成するのであれば有料プランをおすすめします。

使い方は簡単、ChatGPTにDALL-E3を使ってもらえるように〇〇を書いてください。とプロンプトを入力すれば、DALL-E3が画像生成をしてくれます。

ChatGPT(DALL-E3)で画像の生成

プロンプトを入力し、しばらく時間が経つとこのように画像が出力されます!

ChatGPT(DALL-E3)で猫の画像の生成

以前、DALL-E3は一度のプロンプトで4つの画像を生成していました。アップデートによって1枚の画像でしか生成されなくなっています。一度のプロンプトで以前のように何パターンが欲しい場合、プロンプトの中で枚数を指定すれば、分割された画像が生成されます。

なお、無料プランでは何度やっても4分割された画像が生成されなかったため、有料プランで試したところ分割された画像が生成されました。

プロンプト

ふわふわの猫の画像を4パターン作って
ChatGPT(DALL-E3)で4パターンの画像の生成

Bing Image Creator

また、BingのImage Generatorを使えば、DALL-E 3で画像の生成が可能です。

Bing Image Generatorの使い方は非常に簡単で、以下のImage Creatorのサイトにアクセスし、Microsoftアカウントでログインする事で利用できます。

ログインすると以下のような画面になります。

Image Creatorのプロンプト入力場所

赤枠の部分にテキストプロンプトを入力すると画像を生成してくれます。

試しに、「キッチンで音楽を聴きながら踊る猫」と入力してみました。

Image Creatorで猫の画像を生成

本当の写真のように高精細で可愛らしい画像が出力されました。Bing Image Creatorはこちらが指定せずとも4枚の生成された画像を並べてくれます。

また、QAのところには英語のみ対応と書いてあったのですが、これを見ると日本語にもしっかり対応していそうです!

ChatGPTと違って無料で使えるので、ChatGPTの有料プランに入っていない方やDALL-E 3だけを目当てに有料プランに入会する予定の方は、Bing Image Creatorを使った方がよさそうです。

MicrosoftCopilot(旧:Bing Chat)

MicrosoftCopilotでもDALL-E 3を無料で使うことができるようになっています。ただし、商用利用には注意が必要です。Microsoft Designer / Image Creatorの利用規約では「個人的な非商用目的のみ」とされています。法人向けMicrosoft 365 Copilotでは条件が異なる場合があるため、商用利用時はMicrosoftの最新規約を確認するように心がけましょう。

使い方は非常に簡単です。まずはMicrosoftCopilotにログインします。

MicrosoftCopilotへログイン
参考:https://www.microsoft.com/ja-jp/microsoft-copilot/personal-ai-assistant

ログイン後、Copilotの画面に移りますので、あとはメッセージを送るだけです。今回は「可愛い猫のイラストを生成してください」と指示を与えています。

生成された画像はこちら。

MicrosoftCopilotで猫のイラストを生成

「イラスト」という内容のプロンプトだったので、リアルな画像ではなくかわいいイラスト調の画像が生成されました。DALL-E 3を手軽に使ってみたい方は、MicrosoftCopilotで画像生成するのもおすすめです。

Perplexity

Perplexityは検索型のAIサービスですが、PerplexityでもDALL-E 3を使って画像を生成することができます。以前はProプラン限定でしたが、2026年3月現在は無料プランでも一部の画像生成機能を回数制限ありで利用可能です。複数の画像生成モデルから選択でき、プロンプト入力後に自動で画像が生成されます。

また、商用利用は、個人向けプランとEnterprise(法人向け)で条件が異なるため、ビジネス用途の場合はPerplexityの利用規約を確認しましょう。

Perplexityの設定
参考:https://www.perplexity.ai/settings/account  
Perplexityで画像を生成する
Perplexityで画像のスタイルを選択する

生成された画像はこちら

Perplexityで生成された猫の画像

ChatGPTの法人向け有料プランについて知りたい方はこちらをご覧ください。

DALL-E 3をAPIで利用する手順

次にAPI経由でDALL-E 3を動かす手順と使い方についても紹介していきます。ちなみに今回はGoogle Colabのpython環境上にて、DALL-E 3を使ってみました。

2026年3月時点でのAPI選択についても触れておきますと、OpenAIの現行APIでは画像生成モデルとしてgpt-image-1が前面に案内されており、DALL-E 3はPrevious generation / deprecated扱いとなっています。既存のDALL-E 3 APIは引き続き動作しますが、新規で導入される場合はgpt-image-1を推奨します。

ではさっそく、APIキーの発行からみていきましょう!

DALL-E3をAPI経由で使う方法の詳細は下記で紹介。

OpenAIアカウントからAPIキーを発行

まずはOpenAIのアカウントを使って、APIキーを発行していきます。手始めに以下のリンクから、発行用の画面に移動してください。

OpenAI PlatformのAPI発行画面

OpenAI Platformへログイン

ここからログインすると、以下のような画面が表示されます。

OpenAI PlatformでAPIキーを作る

右上のグレーのボタン「+ Create new secret Key」をクリック!するとNameの画面が出てくるので、APIに付けたい名前を入力してください。入力を終えると……

APIキーをコピーする

APIキーが発行されました。あとはAPIキーの右側、「Copy」の部分をクリックするとコピーができます。

API キーの設定

APIを経由してDALL-E 3を使う前に必要な準備を紹介します。

というのは、実行環境側でのAPIキーの設定です。まずは下記のコードを実行してください。

import os
import getpass
os.environ["OPENAI_API_KEY"] = getpass.getpass('OpenAI API Key:')

実行するとプロンプト「OpenAI API Key:」が返ってきます。

GoogleColabでAPIキーを設定する

ここで先ほどのAPIキーを入力してEnterを押せば、連携が完了します。

DALL-E 3を呼び出して画像を生成

さてここからは、python環境上でDALL-E 3のAPIを動かしていきます。

まず下記のコードについて、プロンプト・画像サイズ・画像の品質・生成回数を指定して、実行するのですが…

from openai import OpenAI

client = OpenAI()

#プロンプト・画像サイズ・画像の品質・生成回数を指定

response = client.images.generate(

  model="dall-e-3",

  prompt="プロンプトを指定",

  size="画像サイズを指定",

  quality="画像の品質を指定",

  n=1,

)

image_url = response.data[0].url

print(image_url)

DALL-E 3では、指定できる画像サイズ・画像の品質・生成回数が決まっています。詳細は以下をご覧ください。

DALL-E3で選べる設定

  • 画像サイズ / size:1024×1024 / 1024×1792 / 1792×1024
  • 画像の品質 / quality:standard / HD
  • 生成回数 / n:1回

※ 上記はDALL-E 3 API公開時の仕様です。実装時には、最新のAPI Referenceで対応サイズを確認してください。後継のgpt-image-1ではサイズオプションが異なる場合があります。

先ほどのコードを実行すると画像が生成され、URLで返ってきます。これにてAPI経由でのDALL-E 3の使い方の説明は終わりです。

API経由でDALL-E3を使ってみた!

次はGoogle ColabのPython環境上から、API経由でもDALL-E3を使ってみます。まずは画像サイズを1024×1024の正方形に指定して、スポーツカーの画像を生成してみましょう!

from openai import OpenAI

client = OpenAI()

#プロンプト・画像サイズ・画像の品質・生成回数を指定

response = client.images.generate(

  model="dall-e-3",

  prompt="サーキットを駆け抜けるスポーツカーの画像を生成してください。",

  size="1024x1024",

  quality="standard",

  n=1,

)

image_url = response.data[0].url

print(image_url)

これを実行してみると……

API経由でDALL-E 3を使い、車の画像の生成する

先ほど説明したとおり、画像のURLが返ってきます。果たして、画像はちゃんと生成されているのでしょうか……

API経由でDALL-E 3を使い、車の画像を生成した結果

お見事です!躍動感のある構図にしてくれていますね。

続いて画像サイズを1792×1024の長方形に変えて、今度はトラックの画像を生成してもらいます。

#プロンプト・画像サイズ・画像の品質・生成回数を指定

response = client.images.generate(

  model="dall-e-3",

  prompt="荒野にたたずむトラックの画像を生成してください。",

  size="1792x1024",

  quality="standard",

  n=1,

)

image_url = response.data[0].url

print(image_url)

こちらもGoogle Colab上で実行、URLにアクセスしてみると……

API経由でDALL-E 3を使い、荒野にたたずむトラックの画像を生成した結果

レトロなトラックが生成されています!ノスタルジックな雰囲気が素敵ですね。

次の項目では、実際にChatGPTからDALL-E 3を動かしていきます。先代DALL・E2から進化した、その実力をご覧あれ。

ChatGPTでDALL-E 3を使って画像生成してみた

ChatGPTのDALL-E 3はPCブラウザとスマホアプリの両方で使うことができます。ここではそれぞれのデバイスでDALL-E 3を使い、画像生成を行いました。

ブラウザ版ChatGPTのDALL-E3で画像生成してみた

実際にChatGPTでDALL-E 3を使い、プロンプトを入力して画像を出力してみます。以下のようなChatGPTのプロンプトを入力しました。

プロンプト「黒髪ショートの日本人女性」

ChatGPTでDALL-E 3を使い、黒髪ショートの日本人女性の画像を生成した結果

プロンプト通り、黒髪ショートの日本人女性の画像が生成されましたね。

プロンプト

 This portrait aims to convey the grace and sophistication of a Japanese woman, showcasing her confidence and cultural identity.

2025年11月時点では、DALL-E3で生成された画像に対して編集機能が与えられています。例えば、先ほど生成された黒髪ショートの女性を口角を上げて笑顔に変更したい場合は生成された画像をクリックしたあと、選択ツールを使って口元をなぞります。

ChatGPTでDALL-E 3を使い、生成された黒髪ショートの日本人女性の画像を編集する

マウスでなぞりプロンプトで「口角を上げてください」と指定。

ChatGPTでDALL-E 3を使い、生成された黒髪ショートの日本人女性の画像を編集した結果

モデルの女性はそのままで、指定した部分のみ変更された画像が生成されました。

今までのDALL-E3は同じプロンプトを入力しても、全く同じ画像は生成できませんでした。今では生成された画像から気になる部分を指定してより自分のイメージに近づけられるような細かな調整が可能となりました。

生成される画像は、リアル風 / アニメ・イラスト風 / CG風、と調整も可能です。

DALL-E 3で作られたAI画像は商標利用可かつ著作権フリーのため、AI美女をまとめた本をコンテンツとして売ることもできます。

スマホでChatGPTのDALL-E3で画像生成してみた

次に、スマホ版のChatGPTにてDALL-E3を使って猫の画像を生成してみました。

プロンプト「宇宙を旅する猫の画像を生成してください。」

スマホのChatGPTでDALL-E 3を使い、宇宙を旅する猫の画像を生成

・・・かわいいっ!プロンプト通り、宇宙を旅する猫の画像が生成されました。

続いて、りんごを食べるけど苦手な顔をする猫の画像を生成してみました。

スマホのChatGPTでDALL-E 3を使い、りんごをかじる猫の画像を生成

超不機嫌!しっかり食べたあとも付いているりんごを持った猫の画像が生成されました。

ちょっとありえないような組み合わせでプロンプトを入力したのですが、かなりの再現度でびっくりしました。

スマホ版ChatGPT+DALL-E3はこれだけ高精度な画像が簡単に生成できるのがメリットですが、生成速度はPC版のほうが早いと感じました。

DALL-E 3のプロンプト作成方法

プロンプトの作成にはChatGPTを活用するのが効果的です。例えば、ChatGPTに以下のような文章を打ち込んで、プロンプトを作成してもらいましょう。

あなたはAIに関する経験が豊富な、優秀なプロンプトエンジニアです。
以下の「プロンプト作成のルール」に従って、DALL-E3に効果的な指示を与えるためのプロンプトを考えてください。
<プロンプト作成のルール>
具体的で明確な表現をすること
繊細で想像力豊かな画像を作成すること
ビジュアルが鮮明になるよう色・形・動き・状況などを具体的に記述すること
何を書くかは、このあと指示します。よろしいですか?
ChatGPTでDALL-E 3用のプロンプトを考えてもらう

実際にChatGPTが作ってくれたプロンプトを使って、画像を生成してみましょう。

「食べたくなるような美味しいリンゴ」を描くためのプロンプトを考えてもらいます。

すると、以下のようなプロンプトを作成してくれました。かなり詳細まで表現してくれています。プロンプトの修正が必要な場合は、改めて指示をしましょう。

今回は問題なさそうだったので、そのままDALL-E3に画像を作成してもらいます。

ChatGPTで出力されたDALL-E 3用のプロンプト

完成したのが、以下の画像です。

みずみずしいリンゴが鮮やかに描かれていますね!

生成されたプロンプトを使ってDALL-E 3でりんごの画像を作成した結果

ちなみに、事前に何も指定せず「食べたくなるような美味しいリンゴの画像を作って」とだけ入力した場合は、以下のような画像になりました。

DALL-E 3に単純な指示でりんごの画像作成を依頼した結果

悪くはないですが、少し繊細さに欠ける気がしますね。プロンプトで細かく指示したほうがクオリティが高い画像が生成されています。

描く内容によると思いますが、自分の目的に合わせてChatGPTを使いこなしてください。

DALL-E 3で画像生成するときのコツ

DALL-E3では、シンプルな日本語プロンプトでも精度の高い画像が作成できるような、独自の仕組みを持っています。

簡単な単語のプロンプトでも意味が通じるよう、ChatGPTが書き換えてくれているのです。思いついた日本語で指示をすれば大丈夫。より精度の高い画像を生成可能なプロンプトを教えます!

日本語入力した後に「rewrite natural English and then use this prompt」と入力すると、ユーザーが書いた日本語を英語に翻訳してプロンプトをChatGPTに命令できるので、「rewrite natural English and then use this prompt」を辞書登録して活用してみてください。

さらに精度の高い画像を作成するために、以下のコツを押さえておくと良いかもしれません。

具体的で明確な指示

頭の中のイメージを、なるべく正確な言葉で表現しましょう。

例えば「花」と指示するよりも「真っ赤な一輪のバラの花」と書いた方が正確に伝わります。

また、具体的で明確な指示を与えるためには、DALL-E 3の各所パラメータについての理解も必要です。

  • プロンプト:プロンプトはどんな画像を生成するか指示を与える部分。プロンプトを具体的に詳細に記述することで、理想的な画像生成に近づけます。
  • シード値:シード値は画像生成時に使われるランダムな値。同じ値を使えば同じ人物・モノの生成ができます。
  • 生成ID:生成IDは生成された画像に割り当てられる識別子。生成IDを使うことで特定の画像を参照することができます。
  • アスペクト比:アスペクト比は生成する画像の縦横比

また、それ以外にもプロンプトの与え方も重要です。

例えば「ゴッホのような作画でひまわりを描いてください」というプロンプトでは以下のような画像が生成されます。

DALL-E 3で生成したゴッホが書いたようなひまわり

これをもう少し生成AIが理解しやすい構造化データの一種であるyaml形式で指示を与えてみます。

ひまわり:
  スタイル: "ゴッホ風"
  特徴:
    - 鮮やかな黄色とオレンジの花びら
    - 暗い背景で花を際立たせる
    - 厚みのある筆触と渦を巻いたタッチ

  配置:
    - 花瓶にまとめられたひまわり
    - 花瓶の形: 円筒形
    - 花数: 12本
  色:
    背景: "暗い青または深い緑"
    花瓶: "土色または淡い茶色"

  花:
      - 花びら: "黄色とオレンジ"
      - 茎と葉: "緑"
  光と影:
    - 光源: "画面左上から差し込む自然光"
    - 花びらの陰影: "強調された立体感"
  テクスチャ:
    - 筆触: "厚塗りで立体感がある"
    - 花びらや茎にざらつき感と流れるような筆跡
  雰囲気:
    - 表現: "感情的で生き生きとした印象"

このプロンプトを与えた時の画像が以下です。

DALL-E 3にて構造化データのプロンプトで生成したゴッホが書いたようなひまわり

文章は私たち人間が理解しやすいデータですが、生成AIモデルが理解しやすいとは限りません。どちらかというと構造化データの方がわかりやすいため、構造化データでプロンプトを与えた方がより理想的な画像を生成することができるでしょう。

何度も修正をする

最初から完璧な絵を描こうとするよりも、柔軟に修正していくイメージを持つ方が良いかもしれません。

DALL-E3の特徴として「完成した画像に追加で指示を出して修正できる」という点があります。その特徴を最大限に活かして、トライアンドエラーで画像を作成しましょう。

シード値や画像IDを指定

シード値や画像IDを使うことで、理想とする画像に近づくことができます。前述しましたが、シード値と画像IDは同じ値を使えば生成する人物やモノは同一の状態で、周囲の環境のみを変更したりすることができます。

人物やモノは現状のままでいいんだけど、それ以外の環境を変更したいな、という場合にはシード値や画像IDをうまく使ってみてください。

一度に生成できる画像の枚数を増やす

一度に生成できる画像の枚数を増やすことで、バリエーションが豊富になります。

バリエーションが豊富になるということは、それだけ自分が理想とする画像が生成される確率が高くなります。

1枚の画像を生成するより、複数の画像を生成する方が時間はかかってしまいますが、何度も何度も画像生成を繰り返すよりも、生成枚数を増やして画像を生成した方が理想の画像に近づけるでしょう。

英語プロンプトを利用

生成する画像に文字を入力することもあると思います。画像に文字を入れることはできますが、日本語を入力するよりも英語で入力をした方が精度は高いです。

DALL-E 3にて作った日本語で「自然」と入っている石鹸の画像
DALL-E 3にて作った「natural」と入っている石鹸の画像

一枚目は日本語で「自然」と入力されている石鹸を作って、というプロンプトです。

それに対して二枚目は「natural」と入力されている石鹸、というプロンプトです。

これだけでも日本語を含む画像の生成が苦手なのがわかります。

そのため、画像内に文字を入力したい時には英語で入力するようにプロンプトを出した方が良いでしょう。

画像サイズを指定

画像サイズを指定することも大切です。

例えば人物の全身が写っている画像を生成したい場合には、1024×1024 (スクエア)よりも1024×1792 (フルボディ)の方が全身が写っている画像を生成できる可能性が高いです。

それに対して胸元より上の画像でよければ1024×1792 (フルボディ)にする必要はないので、生成したい画像に応じて画像サイズを指定することも重要です。

DALL-E 3で使えるプロンプト例10選

プロンプトに迷った場合はChatGPTに任せても良いと思いますが、具体的な例のあった方がイメージしやすいかもしれません。

DALL-E3で絵を描くときに使いやすいプロンプト例を10個ご紹介しておきます。

影のような絵のプロンプト

プロンプト例

モノクロームの影絵スタイルで描かれた、動物のシルエットが特徴的な森の風景

影絵の美しさとシンプルさを強調するため、モノクロームで動物のシルエットを用いた森の風景を描きます。

アニメ風の絵のプロンプト

プロンプト例

明るく鮮やかな色彩のアニメスタイルで、都市の風景を背景に持つ元気な若者のグループ

アニメ独特の色彩と表現を活かし、都市風景と若者の活力ある姿を描きます。

リアルな絵のプロンプト

プロンプト例

詳細な質感とリアルな光の表現を用いた、朝日が昇る海辺の風景

リアリスティックな質感と光の表現を重視し、自然の美しさをリアルに描きます。

サイズ指定のプロンプト

プロンプト例

1024x1792サイズで、緑豊かな庭園を散策するエレガントな女性の全身像

特定のサイズに合わせて、風景と人物の関係を強調する全身像です。

アブストラクトな絵のプロンプト

プロンプト例

幾何学的な形と鮮やかな色彩を使った、抽象的な都市の風景画

抽象芸術の特徴である幾何学的形と、色の強調を用いた都市風景です。

水彩画スタイルのプロンプト

プロンプト例

柔らかい水彩画風で描かれた、春の花が咲く公園の風景

水彩画の独特の優しさと、透明感を活かした春の公園風景です。

ヴィンテージ風の絵のプロンプト

プロンプト例

セピア色を基調としたヴィンテージスタイルで描かれた、古い街並みと古典的な自動車

セピア色とヴィンテージな雰囲気で、古い街並みと車を描きます。

ファンタジー風の絵のプロンプト

プロンプト例

魔法と幻想的な生物が満ちる、カラフルで神秘的なファンタジーの世界

ファンタジーの要素を強調し、魔法や幻想的な生物を取り入れたカラフルな世界を表現します。

ポートレート風の絵のプロンプト

1792x1024サイズで、ロマンティックな光の中で微笑む若い女性のポートレート

特定のサイズで、ロマンティックな雰囲気の中にいる女性の表情を捉えたポートレート。

夜景の絵のプロンプト

夜空と星の光が反映される静かな湖の風景、周囲には点灯した街の灯りが見える

夜の美しさと静けさを表現し、湖面に映る星と街の灯りを特徴とする風景を描きます。

これらのプロンプトは、様々なスタイルやシチュエーションに対応するため役立ちます。ぜひ活用してみてください。

DALL-E 3の商用利用や著作権について

DALL-E 3のヘルプを見ると次のような記載があります。

コンテンツポリシーおよび利用規約に従う限り、DALL-Eで作成した画像の所有権はあなたにあります。これには、無料または有料のクレジットを通じて生成された画像に関係なく、再印刷、販売、商品化の権利も含まれます。

引用元:https://help.openai.com/en/collections/3643409-dall-e-content-policy

上記のことからDALL-Eで生成した画像については著作権はユーザー側にあり、商用利用も可能だということです。

そして、コンテンツポリシーには「AI の関与について視聴者を誤解させないでください。」「他人の権利を尊重します。」といった項目も存在します。

つまり「DALL-Eで生成したものは自由に使っていいけれど、生成する際には著作権などを考えて使ってください」ということですね。

ただし、Microsoft Bing Image Creatorは個人の非商業目的のみ利用可能で、商用利用不可となっていますのでご注意ください。

プラットフォームごとの商用利用条件を整理すると以下のとおりです。

スクロールできます
プラットフォーム商用利用備考
ChatGPT(Plus / Team / Enterprise)⭕️OpenAI規約・コンテンツポリシーに従う
ChatGPT(無料プラン)⭕️同上。生成回数に制限あり
Microsoft Copilot / Designer / Bing Image Creator❌️(個人利用のみ)法人向けCopilotは別途規約確認
Perplexity(個人プラン)要確認個人向けとEnterpriseで条件が異なるため、公式サイトを要確認
API経由(dall-e-3 / gpt-image-1)⭕️OpenAI利用規約に従う
DALL-E 3 プラットフォーム別の商用利用条件

性能については、DALL・E2と比べて遥かに向上しているそうなので、どれほどのものなのか後ほど実際に試しますが、まずは公式から公開されている情報から、性能を見ていきましょう!

DALL-E 3の利用料金

DALL-E 3はChatGPTとMicrosoftのBing Image Creatorで使えます。ChatGPTは月20ドルのChatGPT Plusと、企業向けのTeam / Enterpriseの3つの有料プランでDALL-E 3を利用可能です。

Bing Image CreatorはMicrosoftアカウントがあればDALL-E3を無料で使えます。ChatGPTに課金できない方は、Bing Image Creatorを使いましょう。

ただし、「DALL-E 3の商用利用や著作権」でお伝えしたとおり、Microsoft Bing Image Creatorは個人の非商業目的のみ利用可能で、商用利用不可なので気をつけてください。

DALL-E 3の活用事例

ここからはDALL-E 3が実際にどのように活用されているか、企業の公式発表やXの投稿をもとに紹介します。

今回解説する事例において、弊社がX(旧Twitter)で発見した参考となるツイートを紹介させていただいております。取り下げなどのご連絡は、contact@weel.co.jp からご連絡ください。

コカ・コーラ「Create Real Magic」キャンペーン

コカ・コーラの画像生成AIツール

コカ・コーラは、2023年12月、GPT-4とDALL-Eを組み込んだ画像生成AIツール「Create Real Magic」を一般公開しました。ユーザーはコカ・コーラのロゴやサンタクロース、シロクマなどのブランド素材を使い、オリジナルのクリスマスカードを作成できる仕組みです。

このキャンペーンは44カ国で展開され、2023年3月のコンテスト段階では12万点以上の画像が生成されたそうです。

生成した画像はニューヨーク・タイムズスクエアやロンドン・ピカデリーサーカスのデジタルサイネージに掲出されるチャンスもあり、大きな話題となりました。

企業のマーケティングにDALL-E系の技術を組み込んだ代表的な事例です。

建築パースの生成

AI建築デザイナーのYUiCHI氏は、DALL-E 3で建築の断面図とパースを同時に生成できることをX上で紹介し、実際に使用したプロンプトも公開しています。

建築設計の初期段階でイメージを素早く可視化する用途として、設計事務所やデザイナーからの注目が集まった事例です。

複数AIツールの組み合わせワークフロー

AIアーティストのしろやぎ氏は、DALL-E 3で生成した画像をStable DiffusionとPhotoshopで加筆修正するワークフローをX上で公開しました。

DALL-E 3で大まかな構図とコンセプトを生成し、Stable Diffusionで細部を調整、Photoshopで仕上げるという3段階の手法です。

DALL-E 3単体で完結させるのではなく、他のツールと組み合わせることでクオリティを高める実践的なアプローチとして参考になりますね。

DALL-E 3の活用事例について詳しく知りたい方は、下記の記事を合わせてご確認ください。

DALL-E 3のよくある質問

DALL-E 3は日本語で使えるか?

DALL-E 3は日本語でも問題なく使えます。

以下のプロンプトで、DALL-E 3に画像を作ってもらいました。

かなり複雑な文章ですが、日本語の理解度としては非常に精度が高いという印象です。

DALL-E 3は無料で使えるか?

2026年3月現在、DALL-E 3はChatGPTの無料プランでも利用可能です(1日あたりの生成枚数に制限あり)。また、Bing Image CreatorやMicrosoft Copilotでも無料で利用できますが、商用利用はできないためビジネス目的ならChatGPT Plus以上がおすすめです。

DALL-E 3の利用制限回数は?

無料プランだと1日に生成できる画像が制限されているようですが、明確な枚数は不明です。また、画像を生成しようと思うと下記の画像のような表示が出ることが多々ありました。

DALL-E 3にて利用制限がかかっている画像

有料プランのChatGPTを契約しているとDALL-E 3に利用制限回数はないようです。

しかし、短時間に大量のメッセージを送ると速度低下や警告が発生することもあるようなので、注意しましょう。

DALL-E 3とChatGPT Images(GPT-Image-1.5)の違いは?

DALL-E 3は、テキストから画像を生成する専用モデルですが、ChatGPT Images(GPT-Image-1.5搭載)はChatGPTに統合された次世代画像生成機能です。生成速度が最大4倍に高速化し、部分修正の精度やテキスト描画の正確性も大幅に向上しています。

ChatGPT PlusやTeamプランで自動的に利用できるため、特にこだわりがなければ最新モデルがおすすめです。

DALL-E 3のAPIはまだ使える?

2026年3月現在、DALL-E 3のAPIは引き続き利用可能です。ただし、OpenAIのAPIドキュメント上ではPrevious generation / deprecated扱いとなっており、新規開発にはgpt-image-1が推奨されています。

既存実装がすぐに動かなくなることはありませんが、移行を検討するのがよいでしょう。

DALL-E 3を使いこなそう!

DALL-E 3は、プロンプトを打ち込むだけで高品質な画像を自動生成できる画像生成AIの代表的なモデルです。

前バージョンから大幅に進化し、日本語対応やChatGPTとの連携によって、より直感的で扱いやすい存在になりました。画像の一部を修正できる機能や、自然なテキスト入り画像の出力にも対応しており、精度・表現力ともに大きく向上しています。

使い方も非常にシンプルで、ChatGPT PlusやMicrosoft Copilotなどからすぐに始めることができます。アイキャッチ画像や企画提案資料、創作活動、広告素材など、さまざまなシーンで活用できる柔軟さが魅力です。

今後、AI画像生成はますます身近なものになっていくと考えられます。まずはDALL-E 3を使って、自分のイメージを“形”にする楽しさを体験してみてはいかがでしょうか。

最後に

いかがだったでしょうか?

生成AIの進化は、企業のビジュアル制作やマーケティング手法に大きな変革をもたらしています。DALL-E 3の活用が自社の表現力をどう変えるか、可能性を探ってみませんか?

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
商用利用可能な画像生成AIレポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

  • URLをコピーしました!
  • URLをコピーしました!
目次