【DALL-E 3】APIを使って効果的に欲しい画像を作成する方法!料金や注意点についても解説
画像生成AIを使用する際、自分のイメージ通りの画像が生成できないことに不満を感じていませんか?画像サイズや画質を変更できないAIツールが多いため、目的に応じてサイズや画質を変更できないと不便に感じている方もいるでしょう。
DALL-E 3のAPIである「Images API」を使えば、もう画像生成で悩む必要はありません。サイズや画質などのパラメータを細かく指定できるため、ウェブサイトやSNS、ブログ投稿など用途に適した画像を生成できます。
今回は、DALL-E 3の機能を外部環境から使える「Images API」の詳細を解説します。使い方や料金、注意点も詳しく解説しているので、思い通りの画像を生成できるようになるでしょう。
DALL-E 3が使える「Images API」とは?
先駆的な文章生成AIであるGPTを開発したOpenAI社が、画像生成用に開発したAIモデルがDALL-Eです。プロンプトや画像入力に応じて素早く画像を生成します。このDALL-Eモデルを外部環境から利用可能にするのが「Images API」です。
ここでは、DALL-E 3やImages APIの基本を解説します。、
Images APIの概要を紹介
Images APIは、DALL-E 3の画像生成機能を外部環境で使えるようにするAPIです。Google ColabなどのPython環境上で利用できます。
テキストや画像入力に対応しているのはもちろん、パラメータを細かく指定できるのが特徴で、画質や画像サイズを自分好みに調整可能です。
Images APIはPython環境さえあればさまざまなツールに組み込めるので、ツールやアプリの機能を拡張したい場合などに活用を検討してみてください。
DALL-E 3についても紹介
DALL-E 3は、OpenAIが開発した画像生成AIモデルです。2023年9月21日にリリースされ、ChatGPT(有料プラン)上やMicrosoft Bing Image Creator、APIを通して利用できます。
DALL-E 3の主な特徴は以下の通りです。
- 理解力
前のバージョンであるDALL・E2よりも、遥かに高いプロンプトのニュアンスや詳細を理解する能力を持っています。ユーザーのテキストプロンプトに正確に従った画像を簡単に生成できます。 - ChatGPTとの統合
ChatGPT上でネイティブに構築されており、アイデアを提示すると、それをもとにアイデアを具体化する詳細な画像をChatGPTが自動的に生成します。 - 安全性
暴力的、成人向け、または憎悪的なコンテンツを生成する能力は制限されており、フェイクニュースなどに悪用されないために、公人などの名前を含むリクエストを拒否するといった対策も進められています。 - クリエイティブコントロール
DALL・E3で生成されたものの所有権はユーザー側にあるが、著作権侵害対策として、存命アーティストのスタイルでの画像のリクエストを拒否するように設計されています。
特に1番下のクリエイティブコントロールに注目してください。DALL・E 3で生成された画像の所有権はユーザー側にあるので、生成した画像を商用利用することもできます。(Microsoft Bing Image Creatorは不可)
著作権侵害対策も徹底しているなど、クリエイターに対する配慮も素晴らしいですね!
2024年2月からDALL-E 3で生成された画像には、メタデータが埋め込まれるようになりました。このメタデータが削除されない限り、DALL-E 3から生成された画像であることがわかります。昨今問題になっているフェイクニュース対策も強化されています。
DALL-E3はDALL-Eシリーズの3番目に該当するモデルで、先代のDALL-E2と比較しても出力する画像の精度が格段に向上しています。
DALL-E 3について詳しく知りたい方は、下記の記事を合わせてご確認ください。
DALL-E 3をAPI経由で使うメリット
DALL-E 3はChatGPT上での利用が可能で、有料プランに加入していれば準備なしですぐに開始できます。しかし、DALL-E 3をAPI経由で使うと、以下2つのメリットがあります。
- 入力内容が学習されない
- パラメータを手動で指定できる
特に、パラメータを手動で指定できる点が魅力で、画像サイズや画質をユーザーニーズに合わせて指定できます。ここではAPI利用の2つのメリットについて詳しく解説します。
入力内容が学習されない
ChatGPTに入力したデータは、AIモデルの学習に利用される可能性があります。また、生成した画像をモデルが学習するかもしれません。入力内容がAIモデルに学習されてしまうと、企業の秘匿性の高い情報が外部に流出する危険があります。
一方、DALL-E 3をAPIで利用した場合は、入力内容がモデルの学習に使われることはありません。Images APIを自社のツールやサービスに安心して組み込めるのがメリットです。
パラメータを手動で指定できる
Images APIを使えば、画質や画像サイズなどのパラメータを手動で指定できます。ほとんどのツールでは出力する画像の質やサイズは選べないので、これは大きなメリットです。
たとえば、ブログ記事用の画像を生成する場合は、ある程度の大きさがなければ見にくくなってしまうでしょう。逆に、SNS投稿用に大きすぎるサイズの画像を挿入すると、文章とのバランスが悪くなってしまいます。
API経由でのDELL-E 2利用にかかる料金
Images APIを含め、APIの利用料金は定額ではなく従量制です。Images APIの場合は、生成した画像の枚数や品質、サイズによって料金が変動します。
Images APIを利用する際は、以下の料金表を参考にしてください。
モデル | 画質 | サイズ | 価格 |
---|---|---|---|
DALL-E 3 | Standard | 1024×1024 | 0.04ドル/枚 |
DALL-E 3 | Standard | 1024×1792, 1792×1024 | 0.08ドル/枚 |
DALL-E 3 | HD | 1024×1024 | 0.08ドル/枚 |
DALL-E 3 | HD | 1024×1792, 1792×1024 | 0.12ドル/枚 |
DALL-E 2 | 1024×1024 | 0.02ドル/枚 | |
DALL-E 2 | 512×512 | 0.018ドル/枚 | |
DALL-E 2 | 256×256 | 0.016ドル/枚 |
例えば、DALL-E 3で1024×1024の画像を10枚生成すると、0.4ドルの料金がかかります。画像を生成すればするほど、請求額が上がっていくので注意してください。
なお、ChatGPTのAPIついて詳しく知りたい方は、下記の記事を合わせてご確認ください。
画像生成AIのAPI比較
OpenAI社の画像生成モデル「DALL-E」を呼び出せるImage APIの他にも、API経由で画像生成モデルを利用できるサービスがあります。
Stability AI社は「Stable Diffusion」と呼ばれる画像生成モデルを開発しており、最新バージョンである「Stable Diffusion 3」は2024年2月23日にリリースされました。2024年4月にはAPIが公開されています。
DALL-E 3とStable Diffusion 3の共通点
どちらの画像生成モデルもディープラーニング技術を用いて、大量のデータセットから事前学習しています。テキストプロンプトの指示に基づいて、高品質な画像を生成可能です。
APIを介して利用でき、プログラムからのアクセスが容易な点も共通しています。
DALL-E 3とStable Diffusion 3の違い
2つの画像生成モデルの間には違いもあります。ここでは、モデルの特徴と費用の違いを確認しておきましょう。
モデル
DALL-Eは、大規模トランスフォーマーモデルです。計算の並列処理により大規模なデータセットを効率的に学習できるメリットがあります。画像生成以外にも自然言語処理や音声認識など、幅広く活用できる汎用性も特徴のひとつです。
Stable Diffusionは、拡散モデルです。画像からノイズを除去する逆拡散プロセスを通して高精度な画像を生成します。高品質な画像生成用途に特化したモデルです。
費用
DALL-E 3はOpenAI社によって開発されており、収益化や事業の発展に向けた投資が必要です。そのため利用には利用料金が設定され、使うほど金額が大きくなります。
一方、Stable Diffusion 3もAPI経由の利用には料金が掛かります。利用するモデルによって金額は異なりますが、ベーシックなStable Diffusion 3 Largeでは、1回の画像生成で6,5 credits必要です。1000 creditsの値段が$10なので、1画像当たり$0.0065です。※1
DALL-E3をAPIで使うための準備
DALL-E3をAPI経由で使うには、以下4つの準備作業が必要です。
- APIキーを発行
- ライブラリをインストール
- APIキーの設定
- DALL-E 3を呼び出す
ここでは、それぞれの手順の詳細を解説します。
APIキーを発行
DALL-E3をAPI経由で使用するためには、APIキーが必要です。まずは、OpenAI PlatformのAPI発行画面にアクセスし、APIキーを発行しましょう。
リンクからアクセスすると、上記の画面が表示されます。OpenAIのアカウントを持っている方はログインし、持っていない方は作成しましょう。
ログイン後は、上記の画面が表示されます。グレーボタンの「+ Create new secret Key」をクリックするとポップアップ画面が出てくるので、APIの名前など必要事項を入力してください。
入力が終わると、上記画面に示すようにAPIキーが発行されます。APIキーは設定に必要となるので、コピーしてメモに保存しておきましょう。
ライブラリをインストール
Images APIを実行するには、Pythonの実行環境が必要です。今回は、Googleが提供しているGoogle Colabを使ってDALL-E 3を呼び出す手順を紹介します。
Google Colabは、クラウドベースのJupyterノートブック環境です。無料で使えるだけでなくGPUも利用できるので、ユーザーのPC性能に依存することなく高度な計算を実行できます。
Google ColabでDALL-E 3を呼び出すには、以下3つのライブラリが必要です。
- OpenAI Pythonライブラリ / openai
- OSモジュール / os
- getpassモジュール / getpass
上記3つのうち、OpenAI Pythonライブラリはデフォルトで用意されていないため、「!pip install openai」のコードを実行してインストールしましょう。
ここまでで、ライブラリのインストールは完了です。
APIキーの設定
Google ColabでOpenAIのAPIにアクセスするために、作成したAPIキーを設定します。以下のコードを入力して実行してください。
import os
import getpass
os.environ["OPENAI_API_KEY"] = getpass.getpass('OpenAI API Key:')
上記画像のような返答があるので、空欄の箇所に取得したAPIキーを入力してください。APIキーを入力してEnterを押せば、連携が完了します。
DALL-E 3を呼び出す
Google ColabでDALL-E 3を呼び出す際は、以下のコードを入力します。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="モデルを指定",
prompt="プロンプトを指定",
size="画像サイズを指定",
quality="画質を指定",
n=”画像の枚数を指定”,
style=”画像のスタイルを指定”,
response_format=”画像形式を指定”
)
image_url = response.data[0].url
print(image_url)
このコード内では、以下7つの項目を指定する必要があります。それぞれの項目で指定できる内容は以下の通りです。
- モデル / model:dall-e-3 / dall-e-2
- プロンプト / prompt:生成したい画像の具体的な指示
- 画像サイズ / size:1024×1024 / 1792×1024 / 1024×1792 (DALL-E 3)
- 画像の品質 / quality:standard / HD
- 生成回数 / n:1
- スタイル / style:vivid / natural
- 画像形式 / response_format:url / b64_json
モデルとは、画像生成AIに使用したいモデルのことです。「dall-e-3」と「dall-e-2」の2種類から選べますが、画像の精度を重視するなら高性能な「dall-e-3」を選びましょう。
画像サイズは3種類のサイズから選択できます。画質も2種類から選ぶことができ、HDのほうが高画質ですが、その分料金も高くなるので注意してください。
画像スタイルは「vivid 」「 natural」の2種類から選べます。デフォルトでは「vivid (鮮やか)」が選択されているので、実際に試しながらどちらがよいか検証してみてください。
DALL-E 3をAPIで使ってみた!
API経由でDALL-E 3を使う準備が整いました。ここでは、実際に作成した以下5つの画像についてプロンプトなどの検証結果を共有します。
- 黒猫が道を歩いている画像
- バトル漫画の1シーン
- 実在する街の風景
- 実在するメーカーの車
- 実在する野球選手
それでは実際に生成した画像をみていきましょう!
黒猫が道を歩いている画像
まずは、黒猫が道を歩いているシンプルな画像から生成してみようと思います。実際に入力したコードがこちら。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="dall-e-3",
prompt="Image of a black cat walking down the street",
size="1024x1024",
quality="standard",
n=1,
)
image_url = response.data[0].url
print(image_url)
promptの部分には、DeepLで翻訳した文章を入力しています。このコードを実行すると、以下のようにリンクで返答があるので、タップして確認してみましょう。
リンクをタップして実際に表示された画像が以下のものです。
画質は「standard」で指定しているのですが、かなりいいですね!プロンプトの条件もしっかり満たしています。今回はちょっと簡単すぎるプロンプトだったのかもしれないので、次からはもう少し複雑なプロンプトで試してみます。
バトル漫画の1シーン
続いては、バトル漫画の1シーンをImages APIで作成してみます。
入力したコードはこちら。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="dall-e-3",
prompt="Try to generate one scene from a battle manga at a level that can be published in Weekly Shonen Jump",
size="1024x1024",
quality="standard",
n=1,
)
image_url = response.data[0].url
print(image_url)
プロンプトには「バトル漫画の1シーンを週刊少年ジャンプで掲載できるレベルで生成してみて」とちょっと無茶振りした内容を指定しています。
実際に生成された画像が以下のものです。
正直、筆者としてはここまでの画像が出力されるとは思っていませんでした。戦闘描写の迫力はなかなかのものですし、どこか「僕のヒーローアカデミア」みたいな雰囲気があって、確かに週刊少年ジャンプで連載されていそうです。
この機能を使えば、絵に自信がなくてもアイデア次第で漫画家になれるかもしれませんね!
実在する街の風景
今度は、実在する街の風景をImages APIで作成してみます。どこまで高精度で表現できるか楽しみですね!
今回入力したのは、以下のコードです。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="dall-e-3",
prompt="Image of scenery around Kaminarimon in Asakusa",
size="1024x1024",
quality="standard",
n=1,
)
image_url = response.data[0].url
print(image_url)
プロンプトには、「浅草の雷門周辺の風景画像」と入力しています。
そして、実際に出力された画像がこちら。
雷門周辺のお店の通りがしっかりと描かれているほか、奥に東京スカイツリーも描かれていますね!
実在する風景画像も生成できるというのは、1つ大きな発見でした。こちらも漫画などで背景に利用できそうです。
実在するメーカーの車
今度は、実在するメーカーの車をImages APIで生成できるのか実験してみます。おそらく、権利上の関係で正確な画像は出力できないと思われますが、実際のところはどうなのでしょうか。
入力したプロンプトを共有します。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="dall-e-3",
prompt="Nissan Leaf",
size="1024x1024",
quality="standard",
n=1,
)
image_url = response.data[0].url
print(image_url)
今回生成するように指定したのは、日産のリーフです。実際に生成された画像を早速見てみましょう。
やはり、実在するメーカーの車とは別のものが出力されました。しかし、デザインは未来感があってかなりかっこいいですね!
車に限らず、デザイン案で迷ったらDALL-E 3の画像生成機能が役立ちます。デザイン関係の業務を行う会社では、利用しているソフトやアプリにImages APIを連携させてみてもよいかもしれません。
実在する野球選手
最後に、Images APIを使って、実在する人物を描けるのか試してみました。今回は、メジャーリーガーの大谷翔平選手を画像にできるのか試してみます。
入力したプロンプトはこちら。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="dall-e-3",
prompt="Image of the scene where Shohei Ohtani strikes out Trout in the WBC",
size="1024x1024",
quality="standard",
n=1,
)
image_url = response.data[0].url
print(image_url)
プロンプトには、「大谷翔平選手がWBCでトラウトを三振にとったシーンの画像」というように、リアルなシーンを指定しています。
そして、実際に生成された画像が以下のものです。
生成されたのは、大谷翔平選手とはまったく特徴の一致しない謎の画像でした。どうやら実在する人物は画像として生成できないようです。
生成できてしまったら悪用される危険もあるので、筆者も正直ホッとしています。
なお、DALL-E3の他のプロンプト例について詳しく知りたい方は、下記の記事を合わせてご確認ください。
DALL-E 3をAPI経由で使ってみよう!
DALL-E 3は、Images APIというAPI経由で利用できるように機能がリリースされています。Pythonの実行環境があれば、さまざまなツールと連携させられるので、自社で利用しているツールに画像生成機能を拡張することも可能です。
DALL-E 3をAPI経由で使うことには、以下のメリットがあります。
- 入力内容が学習されない
- パラメータを手動で指定できる
パラメータを手動で指定できるので、自分好みの画像を生成可能です。
ただし、APIでDALL-E 3の機能を利用すると、以下のように利用料金が発生するので注意してください。
モデル | 画質 | サイズ | 価格 |
---|---|---|---|
DALL-E 3 | Standard | 1024×1024 | 0.04ドル/枚 |
DALL-E 3 | Standard | 1024×1792, 1792×1024 | 0.08ドル/枚 |
DALL-E 3 | HD | 1024×1024 | 0.08ドル/枚 |
DALL-E 3 | HD | 1024×1792, 1792×1024 | 0.12ドル/枚 |
DALL-E 2 | 1024×1024 | 0.02ドル/枚 | |
DALL-E 2 | 512×512 | 0.018ドル/枚 | |
DALL-E 2 | 256×256 | 0.016ドル/枚 |
APIでDALL-E 3の機能を利用する際は、以下の手順に従って下準備が必要です。
- APIキーを発行
- ライブラリをインストール
- APIキーの設定
- DALL-E 3を呼び出す
今回の記事では、Google Colabを使って、以下5つの画像を生成してみました。
- 黒猫が道を歩いている画像
- バトル漫画の1シーン
- 実在する街の風景
- 実在するメーカーの車
- 実在する野球選手
かなり高精度な画像を出力できますが、他人や他者の権利に触れる内容については生成できません。この点は、安心して画像生成できるようにとユーザーへの配慮を感じます。
Images APIで高度な画像を一瞬で生成できることには変わりないので、デザインに関わる仕事をしているのであれば、ぜひ活用してみてください。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。