【DALL-E 3】APIを使って画像を作成する方法!料金や注意点についても解説
WEELメディア事業部リサーチャーのいつきです。
突然ですが、画像生成AIを使用していて、自分のイメージ通りの画像が出来上がらないことに不満を感じていませんか?特に、画像サイズや画質を変更できないAIツールが多いので、画像の使用用途によっては不便に感じている方が多いはずです。
しかし、DALL-E 3のAPIである「Images API」を使えば、もう画像生成で悩む必要はありません。サイズや画質などのパラメータを細かく指定できるので、SNSやブログ投稿などの用途に適した画像を生成可能です。
今回は、DALL-E 3の機能を使える「Images API」の詳細を解説します。使い方についても詳しく解説しているので、最後まで目を通していただくと、自分の思い通りの画像を生成できるようになるでしょう。ぜひ最後までご覧ください。
なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。
DALL-E 3が使える「Images API」とは?
Images APIとは、その名のとおり、外部のツールでDALL-E 3の画像生成機能を使えるようにするAPIです。また、DALL-E 3はOpenAIが提供している画像生成AIで、プロンプトや画像入力に対して素早く画像を生成する機能があります。まずは、Images APIやDALL-E 3のことがよくわからない方もいると思うので、概要からみていきましょう。
Images APIの概要を紹介
Images APIは、DALL-E 3の画像生成機能を外部で使えるようにするAPIです。おもに、Google ColabなどのPython環境上で利用できます。
テキストや画像入力に対応しているのはもちろん、パラメータを細かく指定できるのが特徴。この機能のおかげで、画質や画像サイズを自分好みに調整できます。
Images APIはPython環境があればさまざまなツールに組み込めるので、特定のツールやアプリの機能を拡張したい場合に連携を検討してみてください。
DALL-E 3についても紹介
DALL-E 3は、OpenAIが提供している画像生成AIです。2023年9月21日からリリースを開始しており、ChatGPT(有料プラン)のチャット上やMicrosoft Bing Image Creator、APIを通して利用できます。
DALL-E 3の詳しい特徴を以下にまとめました。
- 理解力
前のバージョンであるDALL・E2よりも、遥かに高いプロンプトのニュアンスや詳細を理解する能力を持っています。これにより、ユーザーのテキストプロンプトに正確に従った画像を簡単に生成できます。 - ChatGPTとの統合
ChatGPT上でネイティブに構築されており、アイデアを提示すると、それをもとにアイデアを具体化する詳細な画像をChatGPTが自動的に生成します。 - 安全性
暴力的、成人向け、または憎悪的なコンテンツを生成する能力は制限されており、フェイクニュースなどに悪用されないために、公人などの名前を含むリクエストを拒否するといった対策も進められています。 - クリエイティブコントロール
DALL・E 3で生成されたものの所有権はユーザー側にあるが、著作権侵害対策として、存命アーティストのスタイルでの画像のリクエストを拒否するように設計されています。
特に1番下のクリエイティブコントロールに注目してください。DALL・E 3で生成された画像の所有権はユーザー側にあるので、生成した画像を商用利用することもできます。(Microsoft Bing Image Creatorは不可)
また、著作権侵害対策も徹底しているなど、クリエイターに対する配慮も素晴らしいですね!
さらに、2024年2月からDALL-E 3で生成された画像には、メタデータが埋め込まれるようになりました。これにより、メタデータが削除されない限り、DALL-E 3から生成された画像であることがわかるため、昨今問題になっているフェイクニュース対策も施され、ますます強化されました。
ちなみに、DALL-E 3はDALL-Eシリーズの3番目に該当するモデルで、先代のDALL-E 2と比較しても出力する画像の精度が格段に向上しています。
DALL-E 3について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【DALL-E 3】ChatGPTで画像生成する方法!使い方や料金、プロンプトのコツを解説
DALL-E 3をAPI経由で使うメリット
DALL-E 3をAPI経由で使うことには、以下2つのメリットがあります。
- 入力内容が学習されない
- パラメータを手動で指定できる
パラメータを手動で指定できる点が魅力で、画像サイズや画質をユーザーニーズに合わせて指定できます。以下で、メリットについて詳しく解説していくので、ぜひ参考にしてみてください。
入力内容が学習されない
ChatGPTに入力したデータはモデルのトレーニングに利用されることがあるため、DALL-E 3をChatGPTで使用すると生成した画像をモデルが学習する可能性があります。入力内容が学習されてしまうと、企業の秘匿性の高い情報などが外部に漏れ出てしまうため危険です。
一方、DALL-E 3をAPIで利用した場合は、入力内容が学習されることはありません。よって、Images APIを自社のツールやサービスに安心して組み込めるのがメリットです。
パラメータを手動で指定できる
Images APIを使えば、画質や画像サイズなどのパラメータを手動で指定できます。ほとんどのツールでは出力する画像の質やサイズは選べないので、これは大きなメリットです。
たとえば、ブログ記事用の画像を生成する場合は、ある程度の大きさがなければ見にくくなってしまうでしょう。逆に、SNS投稿用に大きすぎるサイズの画像を挿入すると、文章とのバランスが悪くなってしまいます。
APIの料金には要注意
Images APIを含め、APIの料金は月額固定ではありません。Images APIの場合は、生成した画像の枚数や品質、サイズによって料金が変動します。
Images APIを利用する際は、以下の料金表を参考にしてください。
モデル | 画質 | サイズ | 価格 |
---|---|---|---|
DALL-E 3 | Standard | 1024×1024 | 0.04ドル/枚 |
DALL-E 3 | Standard | 1024×1792, 1792×1024 | 0.08ドル/枚 |
DALL-E 3 | HD | 1024×1024 | 0.08ドル/枚 |
DALL-E 3 | HD | 1024×1792, 1792×1024 | 0.12ドル/枚 |
DALL-E 2 | 1024×1024 | 0.02ドル/枚 | |
DALL-E 2 | 512×512 | 0.018ドル/枚 | |
DALL-E 2 | 256×256 | 0.016ドル/枚 |
たとえば、1番上のStandardで1024×1024の画像を10枚生成すると、約60円の料金がかかります。多くの画像を生成すればするほど、請求額が上がっていくので注意してください。
なお、ChatGPTのAPIついて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→ChatGPT APIとは?使い方や料金体系、できること、おすすめ活用事例15選を紹介
DALL-E3をAPIで使うための下準備
DALL-E3をAPI経由で使うためには、いくつかの下準備が必要です。そこで、必要な下準備の手順を以下にまとめました。
- APIキーを発行
- ライブラリをインストール
- APIキーの設定
- DALL-E 3を呼び出す
以下で実際の手順を詳しく解説していくので、ぜひ参考にしてみてください。
APIキーを発行
DALL-E3をAPI経由で使用するためには、APIキーが必要です。まずは、OpenAI PlatformのAPI発行画面にアクセスし、APIキーを発行しましょう。
リンクからアクセスすると、上記の画面が表示されます。OpenAIのアカウントを持っている方はログインし、持っていない方は作成しましょう。
ログイン後は、上記の画面が表示されます。グレーボタンの「+ Create new secret Key」をクリックすると、Nameの画面が出てくるのでAPIにつけたい名前を入力してください。
APIキーの名前の入力が終わると、上記の画面が表示されます。あとでAPIキーを設定する際に必要となるので、一旦この画面のままにしておくか、APIキーをコピーしてメモに保存しておきましょう。
ライブラリをインストール
Images APIを実行するためには、Pythonの実行環境が必要です。今回は、Googleが提供しているGoogle Colabで、DALL-E 3を呼び出す手順を紹介していきますね!
なお、Google Colabは、クラウドベースのJupyterノートブック環境です。無料で使えるだけでなく、GPUも利用できるので、ユーザーのPC性能に依存することなく高度な計算を実行できます。
また、Google ColabでDALL-E 3を呼び出すには、以下3つのライブラリが必要です。
- OpenAI Pythonライブラリ / openai
- OSモジュール / os
- getpassモジュール / getpass
上記3つのうち、OpenAI Pythonライブラリは入っていないので、「!pip install openai」のコードを実行してインストールしましょう。
ここまでで、ライブラリのインストールは完了です。
APIキーの設定
続いて、Google ColabでOpenAIのAPIにアクセスするために、APIキーを設定します。まずは、以下のコードを入力して実行してください。
import os
import getpass
os.environ["OPENAI_API_KEY"] = getpass.getpass('OpenAI API Key:')
上記画像のような返答があるので、空欄の箇所に取得したAPIキーを入力してください。APIキーを入力してEnterを押せば、連携が完了します。
DALL-E 3を呼び出す
早速Google ColabでDALL-E 3を呼び出すのですが、まずは入力するコードの意味を把握しましょう。Google ColabでDALL-E 3を呼び出す際は、以下のコードを入力します。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="モデルを指定",
prompt="プロンプトを指定",
size="画像サイズを指定",
quality="画質を指定",
n=画像の枚数を指定,
)
image_url = response.data[0].url
print(image_url)
コード上で指定する項目をそれぞれまとめました。
- モデル / model:dall-e-3 / dall-e-2
- 画像サイズ / size:1024×1024 / 1024×1792 / 1792×1024
- 画像の品質 / quality:standard / HD
- 生成回数 / n:1回
- スタイル / style:vivid / natural
- 画像形式 / response_format:url / b64_json
まず、モデルは、画像生成AIに使用するモデルのことです。「dall-e-3」と「dall-e-2」の2種類から選べますが、画像の精度を重視するなら高性能な「dall-e-3」を選びましょう。
また、画像サイズは、上記に記載しているとおり、3種類のサイズから選択できます。画質も2種類から選ぶことができ、HDのほうが画質がよいですが、その分料金も高くなるので注意してください。
さらに、スタイルでは生成する画像のスタイルを「vivid 」「 natural」の2種類から選べます。デフォルトでは「vivid (鮮やか)」が選択されているので、実際に試しながらどちらがよいか検証してみてください。
DALL-E 3をAPIで使ってみた!
API経由でDALL-E 3を使う下準備が整ったので、早速筆者もDALL-E 3をGoogle Colab上で使ってみます。ここでは、実際に作成した以下5つの画像についてプロンプトなどの検証結果を共有します。
- 黒猫が道を歩いている画像
- バトル漫画の1シーン
- 実在する街の風景
- 実在するメーカーの車
- 実在する野球選手
それでは実際に生成した画像をみていきましょう!
黒猫が道を歩いている画像
まずは、黒猫が道を歩いているシンプルな画像から生成してみようと思います。実際に入力したコードがこちら。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="dall-e-3",
prompt="Image of a black cat walking down the street",
size="1024x1024",
quality="standard",
n=1,
)
image_url = response.data[0].url
print(image_url)
promptの部分には、DeepLで翻訳した文章を入力しています。このコードを実行すると、以下のようにリンクで返答があるので、タップして確認してみましょう。
リンクをタップして実際に表示された画像が以下のものです。
画質は「standard」で指定しているのですが、かなりいいですね!プロンプトの条件もしっかり満たしています。今回はちょっと簡単すぎるプロンプトだったのかもしれないので、次からはもう少し複雑なプロンプトで試してみます。
バトル漫画の1シーン
続いては、バトル漫画の1シーンをImages APIで作成してみます。
入力したコードはこちら。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="dall-e-3",
prompt="Try to generate one scene from a battle manga at a level that can be published in Weekly Shonen Jump",
size="1024x1024",
quality="standard",
n=1,
)
image_url = response.data[0].url
print(image_url)
プロンプトには、「バトル漫画の1シーンを週刊少年ジャンプで掲載できるレベルで生成してみて」とちょっと無茶振りした内容を指定しています。
そして、実際に生成された画像が以下のものです。
正直、筆者としてはここまでの画像が出力されるとは思っていませんでした。戦闘描写の迫力はなかなかのものですし、どこか「僕のヒーローアカデミア」みたいな雰囲気があって、確かに週刊少年ジャンプで連載されていそうです。
この機能を使えば、絵に自信がなくてもアイデア次第で漫画家になれるかもしれませんね!
実在する街の風景
今度は、実在する街の風景をImages APIで作成してみます。どこまで高精度で表現できるか楽しみですね!
今回入力したのは、以下のコードです。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="dall-e-3",
prompt="Image of scenery around Kaminarimon in Asakusa",
size="1024x1024",
quality="standard",
n=1,
)
image_url = response.data[0].url
print(image_url)
プロンプトには、「浅草の雷門周辺の風景画像」と入力しています。
そして、実際に出力された画像がこちら。
雷門周辺のお店の通りがしっかりと描かれているほか、奥に東京スカイツリーも描かれていますね!
実在する風景画像も生成できるというのは、1つ大きな発見でした。こちらも漫画などで背景に利用できそうです。
実在するメーカーの車
今度は、実在するメーカーの車をImages APIで生成できるのか実験してみます。おそらく、権利上の関係で正確な画像は出力できないと思われますが、実際のところはどうなのでしょうか。
入力したプロンプトを共有します。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="dall-e-3",
prompt="Nissan Leaf",
size="1024x1024",
quality="standard",
n=1,
)
image_url = response.data[0].url
print(image_url)
今回生成するように指定したのは、日産のリーフです。実際に生成された画像を早速見てみましょう。
やはり、実在するメーカーの車とは別のものが出力されました。しかし、デザインは未来感があってかなりかっこいいですね!
車に限らず、デザイン案で迷ったらDALL-E 3の画像生成機能が役立ちます。デザイン関係の業務を行う会社では、利用しているソフトやアプリにImages APIを連携させてみてもよいかもしれません。
実在する野球選手
最後に、Images APIを使って、実在する人物を描けるのか試してみました。今回は、メジャーリーガーの大谷翔平選手を画像にできるのか試してみます。
入力したプロンプトはこちら。
from openai import OpenAI
client = OpenAI()
response = client.images.generate(
model="dall-e-3",
prompt="Image of the scene where Shohei Ohtani strikes out Trout in the WBC",
size="1024x1024",
quality="standard",
n=1,
)
image_url = response.data[0].url
print(image_url)
プロンプトには、「大谷翔平選手がWBCでトラウトを三振にとったシーンの画像」というように、リアルなシーンを指定しています。
そして、実際に生成された画像が以下のものです。
生成されたのは、大谷翔平選手とはまったく特徴の一致しない謎の画像でした。どうやら実在する人物は画像として生成できないようです。
生成できてしまったら悪用される危険もあるので、筆者も正直ホッとしています。
なお、DALL-E3の他のプロンプト例について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【DALL-E 3】ChatGPTでヤバい画像を作る最強の使い方・プロンプト10選
DALL-E 3をAPI経由で使ってみよう!
DALL-E 3は、Images APIというAPI経由で利用できるように機能がリリースされています。Pythonの実行環境があれば、さまざまなツールと連携させられるので、自社で利用しているツールに画像生成機能を拡張することも不可能ではありません。
また、DALL-E 3をAPI経由で使うことには、以下のメリットがあります。
- 入力内容が学習されない
- パラメータを手動で指定できる
パラメータを手動で指定できるので、自分好みの画像を生成しやすくなっています。
ただし、APIでDALL-E 3の機能を利用すると、以下のように料金が発生するので注意してください。
モデル | 画質 | サイズ | 価格 |
---|---|---|---|
DALL-E 3 | Standard | 1024×1024 | 0.04ドル/枚 |
DALL-E 3 | Standard | 1024×1792, 1792×1024 | 0.08ドル/枚 |
DALL-E 3 | HD | 1024×1024 | 0.08ドル/枚 |
DALL-E 3 | HD | 1024×1792, 1792×1024 | 0.12ドル/枚 |
DALL-E 2 | 1024×1024 | 0.02ドル/枚 | |
DALL-E 2 | 512×512 | 0.018ドル/枚 | |
DALL-E 2 | 256×256 | 0.016ドル/枚 |
APIでDALL-E 3の機能を利用する際は、以下の手順に従って下準備が必要です。
- APIキーを発行
- ライブラリをインストール
- APIキーの設定
- DALL-E 3を呼び出す
今回の記事では、Google Colabを使って、以下5つの画像を生成してみました。
- 黒猫が道を歩いている画像
- バトル漫画の1シーン
- 実在する街の風景
- 実在するメーカーの車
- 実在する野球選手
かなり高精度な画像を出力できますが、他人や他者の権利に触れる内容については生成できません。この点は、安心して画像生成できるようにとユーザーへの配慮を感じますね。
ただ、Images APIで高度な画像を一瞬で生成できることには変わりないので、デザインに関わる仕事をしているのであれば、ぜひ活用してみてください。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。