【DALL-E 3】ChatGPTで画像生成できるDALL-E 3を使ってみた!無料での使い方も伝授

皆さんはDALL-E 3をご存じですか?
先日、OpenAI社から発表された最新の画像生成AIで、ChatGPTを使って画像を生成することができるんです!
なんとこんなことができちゃうんです!
従来のものから大幅に性能が向上しており、プロンプトのニュアンスを理解して入力に忠実な画像を生成してくれます。
今回はDALL-E 3の概要や使い方、他の画像生成AIとの比較、OpenAIの公式リリース前からDALL-E 3を使う方法を紹介していきます。
DALL-E 3の活用事例について知りたい方はこちらの記事をご覧ください。
是非最後までご覧ください!
なお弊社では、ChatGPT業務活用についての1時間無料相談を承っています。こちらからお気軽にご相談ください。
→無料相談で話を聞いてみる
DALL-E 3の概要
DALL-E 3は2023年9月21日にOpenAI社が公開したばかりの最新の画像生成AIで、テキストプロンプトからその内容を反映した画像を生成するDALLシリーズの最新版です。
そんなDALL-E 3の特徴は以下の4つです。
理解力:前のバージョンであるDALL・E2よりも、遥かに高いプロンプトのニュアンスや詳細を理解する能力を持っています。これにより、ユーザーのテキストプロンプトに正確に従った画像を簡単に生成できます。
ChatGPTとの統合:ChatGPT上でネイティブに構築されており、アイデアを提示すると、それをもとにアイデアを具体化する詳細な画像をChatGPTが自動的に生成します。
安全性:暴力的、成人向け、または憎悪的なコンテンツを生成する能力は制限されており、フェイクニュースなどに悪用されないために、公人などの名前を含むリクエストを拒否するといった対策も進められています。
クリエイティブコントロール:DALL・E 3で生成されたものの所有権はユーザー側にあるが、著作権侵害対策として、存命アーティストのスタイルでの画像のリクエストを拒否するように設計されています。
さらに、クリエーターは、将来の画像生成モデルのトレーニングから自分の作品の仕様を拒否することができます。
やはり、とても大規模で高性能なモデルなので、多くの人が使用することが予想されるので、悪用されないための対策や、プロクリエイターの方を守るような対策を積極的に行っているようです。
DALL-E 3を使う方法と利用料金について
DALL-E 3はChatGPTとMicrosoftのBing Image Creatorで使うことができます。
ChatGPTは月20ドルのChatGPT Plusと、企業向けのEnterpriseの2つの有料プランでDALL-Eを利用可能です。
Bing Image CreatorはMicrosoftアカウントがあればDALL-Eを無料で使うことができます。
DALL-E 3を利用した作品の著作権や商用利用について
DALL-E 3のヘルプを見ると次のような記載があります。
コンテンツポリシーおよび利用規約に従う限り、DALL-Eで作成した画像の所有権はあなたにあります。これには、無料または有料のクレジットを通じて生成された画像に関係なく、再印刷、販売、商品化の権利も含まれます。
上記のことからDALL-Eで生成した画像については著作権はユーザー側にあり、商用利用も可能だということです。
そして、コンテンツポリシーには「AI の関与について視聴者を誤解させないでください。」「他人の権利を尊重します。」といった項目も存在します。
つまり「DALL-Eで生成したものは自由に使っていいけれど、生成する際には著作権などを考えて使ってください」ということですね。
ただし、Microsoft Bing Image Creatorは個人の非商業目的のみ利用可能で、商用利用不可となっていますのでご注意ください。
性能については、DALL・E2と比べて遥かに向上しているそうなので、どれほどのものなのか後ほど実際に試しますが、まずは公式から公開されている情報から、性能を見ていきましょう!
DALL-E 3の性能
ここからは、実際にDALL-E 3で生成された画像と、DALL・E2との比較を公式サイトや公式Xからの情報をもとに紹介していきます。
公式サイト:dell-e-3
まず、生成された画像をいくつかピックアップしてご紹介します。
1. モダンな建物
A modern architectural building with large glass windows, situated on a cliff overlooking a serene ocean at sunset.
(夕暮れ時の穏やかな海を望む崖の上に建つ、大きなガラス窓を備えたモダンな建築の建物。)
とっても綺麗な画像ですね!これをAIが生成したと思うと驚きです。
画像の内容も、プロンプトを忠実に再現したものになっており、それほど詳しく指定しなくても、高品質の画像を生成してくれることが分かります。
2. 人間の心臓
An illustration of a human heart made of translucent glass, standing on a pedestal amidst a stormy sea.
Rays of sunlight pierce the clouds, illuminating the heart, revealing a tiny universe within.
The quote 'Find the universe within you' is etched in bold letters across the horizon.
(嵐の海で台座の上に立っている半透明のガラスでつくられた人間の心臓のイラスト。太陽光線が雲を突き抜けて心臓を照らし、その中に小さな宇宙が見える。水平線の向こう側には、『Find the universe within you 』という言葉が太い文字で刻まれている)
こちらは、かなり詳細で複雑な指定をしていますが、こちらも忠実に再現されており、かつとても詳細で綺麗な画像が生成されています。
DALL-E 3の認識能力の高さが伺えますね!
このような超高性能画像生成AIがChatGPTで簡単に使用できるので、他の画像生成AIは太刀打ちできないかもしれません。
次に、DALL-E 2からどれほど進化したのか示す比較を見ていきましょう。
以下のプロンプトを入力し、出力された画像です。
An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.
和訳:星雲の爆発として描かれたバスケットボール選手のダンクを表現した油絵
DALL-E 2
DALL-E 3
こう見るとディテールが全然違いますよね!
どちらも正しくプロンプトを認識して画像を出力していますが、DALL-E 3は一つ一つの指定を忠実に高精細に表現しており、もはやアートのような感じさえあります。
これは一刻も早く自分で試してみたいので、早速使っていきましょう!
まずは使い方から説明します。
超高速の画像生成AIについて知りたい方は、以下の記事をご覧ください。
なお、超高速の画像生成AIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【InstaFlow】Stable Diffusionの40倍の速さで画像生成できるAI
DALL-E 3の使い方
それでは、DALL-E 3の使い方を解説します。
ChatGPT
私も利用できるようになっていたので、利用方法をご紹介します。ちなみに、利用可能かどうかの通知はないため、毎日チェックしましょう!
導入する際、特に難しいことはなく、GPT 4→DALL-E 3と選ぶと利用可能です。ただし、ChatGPT Plusユーザー(月額20ドル)でなければなりません。
プロンプトを入力し、しばらく時間が経つとこのように画像が出力されます!
Xのポストも載せておきますので、ご参考になさってください!
このようなやりとりもできるそうです。
Bing Image Creator
今すぐにDALL-E 3を使う方法はBingのImage Generatorを使うことです。
Bingでの使い方は非常に簡単で、以下のImage Creatorのサイトにアクセスし、Microsoftアカウントでログインする事で利用できます。
Image Creator for Microsoft Bing
アクセスしてログインすると以下のような画面になります。
赤枠の部分にテキストプロンプトを入力すると画像を生成してくれます。
試しに、「キッチンで音楽を聴きながら踊る猫」と入力してみました。
本当の写真のように高精細で可愛らしい画像が出力されました。
また、QAのところには英語のみ対応と書いてあったのですが、これを見ると日本語にもしっかり対応していそうです!
ChatGPTと違って無料で使えるので、ChatGPTの有料プランに入っていない方やDALL-E 3だけを目当てに有料プランに入会する予定の方は、こちらを使った方がよさそうです。
ChatGPTでDALL-E 3を使って画像生成してみた
ChatGPTはPCとスマホの両方で使うことができます。
ここではそれぞれのデバイスでDALL-E 3を使い、画像生成を行いました。
使うエンジンは同じなのですが、
PCでChatGPTのDALL-E3を使って画像生成してみた
実際にChatGPTでDALL-E 3を使い、プロンプトを入力して画像を出力してみます。
以下のようなChatGPTのプロンプトを入力しました。
黒髪ショートの日本人女性
すると、この内容から、DALL-E 3用の英語でのプロンプトを4つ考えてくれました。
Photo of a Japanese woman with short black hair, wearing a casual outfit, looking at the camera with a confident smile.
Photo of a Japanese woman with short black hair, dressed in traditional kimono, standing in front of a cherry blossom tree.
Illustration of a Japanese woman with short black hair, wearing a modern urban outfit, holding a cup of coffee.
Watercolor painting of a Japanese woman with short black hair, in a serene setting, with soft lighting highlighting her features.
これに基づいて4つの画像が出力されました。
一つのプロンプトから、様々なスタイルで描かれるのは驚きですね。
好きなスタイルを選んで、さらに4枚出してもらうことも可能です。
画像生成が捗りそうですね!
なお、DALL-E 3とほぼ同時期に提供されたGPT 4の新機能GPT 4Vについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【GPT 4V】ChatGPTがマルチモーダル対応!何がすごいかを徹底解説
スマホでChatGPTのDALL-E3を使って画像生成してみた
次に、スマホ版のChatGPTにてDALL-E3を使って2つほど猫の画像を生成してみました。
宇宙を旅する猫の画像を生成してください。
・・・かわいいっ!
プロンプト通り、宇宙を旅する猫の画像が生成されました。
ただ、PC版と違って画像の枚数は2枚でした。
次はどうでしょうか。
りんごを食べるけど苦手な顔をする猫の画像を生成してください。
超不機嫌!なんなら今すぐにでも噛みつきそうな猫の画像が生成されました。
ちょっとありえないような組み合わせでプロンプトを入力したのですが、かなりの再現度でびっくりしました。
スマホ版ChatGPT+DALL-E3はこれだけ高精度な画像が簡単に生成できるのがメリットですが、生成速度はPC版のほうが早いと感じました。
DALL-E 3の「入力のニュアンスを正確に理解できる」という強みは本当なのか?
さて、次はDALL-E 3の推しポイントである「入力のニュアンスを正確に理解できる」は本当なのかを検証します。
以下の抽象的な画像を生成するプロンプトを入力し、Midjourneyと比較します。
A mysterious landscape in a dream, painted in watercolor. Floating islands and stars fill the space.
(水彩画で描かれた、夢の中の不思議な風景。浮遊する島々と星々が空間を埋め尽くしている。)
検証するポイントは、以下の5つです。
・具体的な要素の確認: 画像に「浮遊する島々と星々」という具体的な要素が明確に表示されているか
・スタイルの確認:生成された画像が「水彩画」のスタイルであるか
・テーマや雰囲気の照らし合わせ:画像が「夢の中の不思議な風景」というテーマや雰囲気を適切に反映しているか
・詳細な要素のチェック:プロンプトに記された要素が全て画像に反映されているか
・主観的な評価:プロンプトに合致していると感じるか
まずはDALL-E 3で作った画像がこちらです。
4枚全ての評価は難しいので、左上の画像だけについて言及しますが以下の通りです。
・具体的な要素の確認:画像には浮遊する島々や星々、そして雲間から見える風景が明確に描写されています。これらの要素は「浮遊する島々と星々」という記述を適切に反映しています。
・スタイルの確認:画像は、水彩画の特徴である滲みややわらかい色のグラデーションを持っており、これは「水彩画」というスタイル要求を十分に満たしていると考えられます。
・テーマや雰囲気の照らし合わせ:画像は、夢の中のような幻想的で神秘的な雰囲気を持っており、「夢の中の不思議な風景」というテーマを良く反映しています。
・詳細な要素のチェック:画像には、プロンプトに記述された「浮遊する島々と星々」や「水彩画で描かれた」という要素が明確に反映されていると言えます。
・主観的な評価:この画像は、抽象的なプロンプトに対して非常によく合致していると感じます。特に、夢の中で見るかのような神秘的な風景が繊細な水彩画のスタイルで表現されており、非常に美しいと感じました。
DALL-E 3によって生成された画像は、プロンプトの要求に非常によく応えていると評価できます。特に「夢の中の不思議な風景」や「浮遊する島々と星々」といった部分が明確に表現されており、これはDALL-E 3の高度な生成能力を示しています。
類似の画像生成サービスであるMidjourneryで作った画像はこちらです。
こちらも4枚全ての評価は難しいので、左上の画像だけについて言及しますが以下の通りです。
・具体的な要素の確認:画像には山や星々、そして水面や崖のような風景が明確に描写されています。特に、空に星々が描かれており、これは「浮遊する島々と星々」という要素を反映していると言えます。
・スタイルの確認:生成された画像は、水彩画のような滲みや流れるようなテクスチャーを持っています。このスタイルは「水彩画」という要求を満たしていると言えるでしょう。
・テーマや雰囲気の照らし合わせ:画像全体の色合いや星々、そして山々の風景は、非現実的で神秘的な雰囲気を持っており、「夢の中の不思議な風景」というテーマに合致していると感じます。
・詳細な要素のチェック:画像には、プロンプトに記述された「浮遊する島々と星々」という要素が反映されています。また、「水彩画で描かれた」というスタイルの要求も満たしているように見えます。
・主観的な評価:この画像は抽象的なプロンプトを非常にうまく反映しており、期待以上の出力と言えるでしょう。夢の中で見るかのような不思議な風景が、繊細な水彩画のスタイルで描かれています。
Midjourneyによって生成された画像も、その独自のスタイルでプロンプトの要求を満たしています。特に「水彩画」という部分に関しては、非常に繊細かつリアルな質感を持っており、この点での評価は高いです。
しかし、全体的な雰囲気やテーマに関しては、DALL-E 3がより「夢の中の不思議な風景」という部分を強調していると感じます。この点において、DALL-E 3は入力のニュアンスをより正確に理解し、それを画像として表現する能力に優れていると言えるでしょう。
以上で、DALL-E 3の検証パートは終わりです。
なお、画像生成AIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【無料あり】画像生成AI!超おすすめの神ツール比較まとめ5選
DALL-E 3をChatGPTで使いこなそう!
DALL-E 3は2023年9月21日にOpenAI社が公開したばかりの最新の画像生成AIで、テキストプロンプトからその内容を反映した画像を生成するDALLシリーズの最新版です。
Microsoft BingのImage Creatorと、ChatGPTのPlusとEnterpriseの2つの有料プラン向けに提供され、誰でも簡単にChatGPTでDALL-E 3を使用することができます。
先代のDALL・E2から大幅に進化しており、入力の認識能力だけでなく、生成画像も超高精細になっています。
なお、DALL-E 3の活用事例について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【DALL-E 3】ChatGPTでヤバい画像を作る最強の活用事例10選
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「1時間の無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。