OpenAIのAPIまとめ!AIモデルと料金プラン、使い方を徹底解説
WEELメディアリサーチャーのいつきです。
外部のシステムにOpenAIの機能を連携させる際に使用する「OpenAI API」ですが、多くの種類が存在するため、その全容を理解しきれていない方も多いのではないでしょうか。
そこで今回は、現在提供されている「OpenAI API」をまとめてみましたので詳細を解説します。
最後までお読みいただくと、今まで気づいていなかった機能を見つけて、既存システムの改良や新たなサービスの創出に活かせるかもしれません。
ぜひ最後までご覧ください。
「OpenAI API」とは
OpenAI APIとは、OpenAIが開発したAI技術を外部サービスでも利用できるようにするAPIサービスのことです。外部サービスとOpenAI APIを連携させることで、自然言語処理や画像生成、音声認識などの機能を誰でも利用できるようになります。
なお、OpenAI APIはChatGPTのように月額課金ではなく、入力や出力トークンに対する従量課金制です。
開発者がプログラミング言語を使用してAPIにアクセスすることで、OpenAIが提供しているさまざまなAI技術を外部サービスで利用できるようになります。
OpenAI APIで提供中のAIモデルと料金
AIモデル名 | 料金 |
---|---|
gpt-4o | 2.50ドル/1M 入力トークン 1.25ドル/1M キャッシュされた入力トークン 10.00ドル/1M 出力トークン |
gpt-4o-mini | 0.150ドル / 1M 入力トークン 0.075ドル / 1M キャッシュされた入力トークン 0.600ドル / 1M 出力トークン |
OpenAI o1 | 15.00ドル / 1M 入力トークン 7.50ドル / 1M キャッシュされた入力トークン 60.00ドル / 1M 出力トークン |
OpenAI o1-mini | 15.00ドル/1M 入力トークン 7.50ドル/1M キャッシュされた入力トークン 60.00ドル/1M 出力トークン |
gpt-4o-realtime-preview | テキスト 5.00ドル / 1M 入力トークン 2.50ドル / 1M キャッシュされた入力トークン 20.00ドル / 1M 出力トークン 音声 100.00ドル / 1M 入力トークン 20.00ドル / 1M キャッシュされた入力トークン 200.00ドル / 1M 出力トークン |
Code Interpreter | 0.03ドル / セッション |
DALL·E 3 | 0.040ドル / 1枚(Standard、1024×1024) 0.080ドル / 1枚(HD、1024×1024) |
Whisper | 0.006ドル / 分 |
OpenAI APIで提供中のAIモデルと料金の代表例を上記にまとめました。
基本的には入力トークンや出力トークン数に対して従量課金で料金が発生します。画像は作成枚数、音声モデルは時間で料金が変動するのが特徴です。
上記表で紹介しているモデル以外にも多数のモデルが存在するので、詳しくはOpenAIの公式サイトを確認してみてください。
なお、ChatGPTについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
OpenAI APIで使える主な機能
OpenAI APIで使える主な機能は以下のとおりです。
- Chat Completions API
- Realtime API
- Assistants API
- Batch API
- JSONモード(Structured Outputs)
- Fine-tuning
- Model distillation
- ナレッジ検索
- Code Interpreter
- Function Calling
- ストリーミング
以下でそれぞれの機能詳細を解説していきます。
Chat Completions API
ChatGPTの代表的な機能である、チャット形式でのやり取りを外部のサービスでもできるようにするAPIです。大規模言語モデルを使用して、入力されたプロンプトからニーズに沿ったテキストを生成してくれます。
生成できるテキストの種類は豊富で、コード・数式・構造化された JSON データ・人間のような散文などです。ChatGPTと同等の機能を外部サービスでも利用できるので、自社サービスにAIチャットボットを導入したい場合に利用してみてください。
Realtime API
Realtime APIは、リアルタイムで音声を使ったやり取りができるようになるAPIです。音声入力と出力をリアルタイムにストリーミングする仕組みを採用しているので、遅延が少なく、自然な会話を楽しめます。
OpenAI APIには、似たような音声モデルとしてWhisperも存在しますが、Realtime APIとは音声を認識してから出力するまでの工程が全く異なります。
Whisperで音声を認識してテキストに変換したあと、推論をおこなう言語モデルやテキストを出力するテキスト読み上げモデルと併用する必要があったため、会話に遅延が発生しがちでした。
しかし、Realtime APIはこれらの課題を解決しているので、スムーズなやり取りを体感できます。
Assistants API
Assistants APIは、外部サービスにAIアシスタントを実装できるAPIです。コーディングなしでAIアシスタントを作成できるため、非エンジニアでも手軽に利用できます。
Assistants APIには、おもに以下4つの機能が備わっています。
- Persistent Threads:スレッド形式で過去の会話を保存できる機能
- Data Retrieval:PDFファイルをエンコーディングなしでアップロードできる
- Code Interpreter:自然言語を入力してコードを生成できる
- Function Calling:プロンプトに応じた関数を呼び出す機能
自社サービスに組み込めば、サービス利用者の利便性が向上するので、ぜひ試してみてください。
Batch API
Batch APIとは、大量のリクエストを非同期の状態で処理できるAPIです。通常、ChatGPTなどでは一問一答形式でやり取りしますが、Batch APIでは一度に大量のプロンプトを入力して、24時間以内にまとめて回答が返ってくる仕組みを採用しています。
なお、Batch APIはほかの同期型のAPIの半額で利用できる点も大きなメリットです。データ分析や整理といった作業に最適なため、開発者の利用に向いています。
JSONモード(Structured Outputs)
JSONモードとは、出力結果が必ずJSON形式になるモードです。JSONモードを利用すると、出力の結果が一定の形式で統一されるので、出力をプログラム上で扱う際に活躍します。
一方、JSONモードを利用しない場合、JSONを出力するよう指定しても、JSON以外の余計なテキストが混じるケースがあります。
Fine-tuning
Fine-tuningは、OpenAIから提供されているAIモデルを微調整する機能です。APIを通じて利用できるAIモデルを微調整することで、回答精度を高めたり、効率を高めたりできます。
たとえば、1つのプロンプトに対して多くの選択肢を提案しないようにもできるので、出力トークン数を抑えてコストを節約可能です。
Model distillation
Model distillationは、OpenAIのプラットフォーム内で、AIモデルを蒸留できる機能です。AIモデルの蒸留とは、大規模なAIモデルをベースにして、同じ機能を備えたより小さなAIモデルを開発する手法を指しています。
o1-preview や GPT-4oなどの高性能モデルの出力を使用して、GPT-4o miniなどのコスト効率の高いモデルを微調整することで、パフォーマンスを向上させられます。
ナレッジ検索
ナレッジ検索とは、膨大なデータベースから必要な情報をスムーズに抽出するプロセスのことです。OpenAI APIにもナレッジ検索を可能にする機能が搭載されています。
たとえば、Assistants File Searchの機能を使うと、AIモデルに独自の製品情報やユーザーが提供するドキュメントなどの外部データを学習させられます。
この機能により、AIモデルが元々学習していた情報以外の情報にアクセスできるので、回答の幅が広がるのがメリットです。
Code Interpreter
Code Interpreterは、自然言語を入力してコードを生成できる機能です。Pythonなどの言語を使用する際は、チャット上に仮装環境を構築して、プログラミングコードの実行までしてくれます。
エンジニアはもちろん、非エンジニアでも突発的にコードが必要になった際に便利なので、ぜひ使ってみてください。
Function Calling
Function Callingは、OpenAI APIを通じて、プロンプトに応じた関数を呼び出す機能です。たとえば、外部システム上でOpenAI APIの機能を起動して天気について尋ねると、天気APIから関数を呼び出して回答を出力してくれます。
関数の指定さえすれば、関数を使用するかしないかはOpenAI API側が自動で判断してくれるのが特徴です。AIモデルが元々学習していない外部のデータにアクセスできるようになるので、回答の幅が広がります。
ストリーミング
ストリーミングは、OpenAIのAPIを通じてリアルタイムでデータを受信できる機能です。チャットでプロンプトを入力したあとのレスポンスが高速になるので、ユーザー体験が向上します。
ストリーミングは、チャット完了APIとアシスタントAPIの2つでサポートされているのが特徴です。
なお、ChatGPTのAPIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
OpenAI APIの使い方
OpenAI APIの使い方について、以下の手順を詳しく解説していきます。
- アカウント登録手順
- 決済情報の登録手順
- APIキーの発行手順
- APIキーの管理方法
- Pythonでの基本的な使い方
アカウントの登録手順から解説していくので、まだChatGPTなどを使ったことがない方も参考にしてみてください。
アカウント登録手順
まずは、OpenAIのアカウントを作成します。
OpenAIのChatGPTの公式サイトにアクセスして、「今すぐ始める」をクリックしてください。
ログインを求められるので、「アカウントをお持ちではありませんか?」のアカウント部分をクリックしてアカウントを作成してください。
アカウントを作成する際は、メールアドレスなどの必要な情報を入力します。
決済情報の登録手順
決済情報を登録する際は、OpenAI Platformのサイトにアクセスして、「請求する」→「支払いの詳細を追加する」をクリックします。
個人か会社か聞かれるので、該当するものを選択してください。
あとは住所やカード情報を入力して完了です。
APIキーの発行手順
APIキーは、OpenAI Platformのサイトにアクセスして、「API key」→「Create new secret key」をクリックすることで発行できます。
上記画面に切り替わるので、コピーをクリックして、メモアプリなどにAPIキーを保存してください。
APIキーを再度表示できない点に注意が必要です。
APIキーの管理方法
作成したAPIキーは、OpenAI Platformのサイトにて管理されています。作成日や最後に使用した日、権限などを確認可能です。
使用状況ページを開くと、画像や音声などのモードごとのリクエスト回数、料金などを確認できます。
Pythonでの基本的な使い方
OpenAI APIをPython環境で実行する際の基本的な使い方を紹介します。今回はGoogle Colabで実践しました。
まずは、以下のコードを実行してOpenAI Pythonライブラリをインストールします。
!pip install openai
次に、以下のソースコードを実際のAPIキーで置き換えて、Google Colab上で実行しましょう。
#"APIキー"の部分に発行したキーの文字列を入力する。
import os
os.environ["OPENAI_API_KEY"] = "APIキー"
以下の画像のように左側にチェックマークが入ればOKです。
APIキーの入力まで済ませたら、あとはモデル名・役割・プロンプトを入力して、実際にPython環境でOpenAI APIを実行してみましょう。
from openai import OpenAI
client = OpenAI()
#役割・プロンプトの指定
response = client.chat.completions.create(
model = "モデル名",
messages = [
{"role": "system", "content": "ChatGPTの役割"},
{"role": "user", "content": "プロンプト(ユーザー側)"}
]
)
# 応答の表示
text = response.choices[0]
print(text)
上記はOpenAI APIを通して回答を得るための基本のコードです。モデル名・ChatGPTの役割・プロンプトの欄を任意のものに置き換えるだけで、OpenAI APIを実行して指定したAIモデルから回答を得られます。
OpenAI APIの活用シーン
OpenAI APIのおもな活用シーンをまとめました。
- AIチャットボット
- 顧客向けAIサービス
- AIエージェント
以下でそれぞれの活用シーンを具体的に解説していきます。
AIチャットボット
OpenAI APIを利用すれば、自社サービスや社内用にAIチャットボットの開発・導入ができます。ちょっとした疑問を解決するのに最適なため、人間が問い合わせに対応する手間が省けて業務の効率化が可能です。
なお、ChatGPTなどをそのまま使うと、事前に学習した範囲の情報しか答えられないため、専門的なやり取りには向きません。
一方、OpenAI APIとLangchainやllamaindexなどのPythonライブラリを組み合わせれば、外部データにアクセスできるようになるので、これらの課題を解決できます。
顧客向けAIサービス
OpenAI APIを利用して、顧客向けAIサービスを構築することも可能です。テキスト生成はもちろん、画像・音声・コードといった、さまざまなものを生成できるため、自社サービスと組み合わせれば新たな価値を顧客に提供できます。
実際に、問い合わせ業務削減や営業支援を目的として、ChatGPT機能搭載のAIサービスを提供している企業が存在します。※1
AIエージェント
AIエージェントとは、人間が極力介入せずとも、AIが特定のタスクをこなしてくれる機能です。OpenAI APIを通して、AIエージェントの構築ができます。
たとえば、Adaが提供しているカスタマーサービス自動化プラットフォームがいい例です。※2
OpenAI APIによって動作するAIエージェントを提供していますが、OpenAI APIを利用していない前バージョンの製品と比較すると、質問の解決率が最大で50%ほど向上しています。
なお、AIエージェントについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
OpenAI APIを使いこなして自社サービスをアップデートしよう!
OpenAI APIは、OpenAIが提供しているAIモデルを外部サービス上から利用できるようにする機能です。
おもに以下のようなことが実現できます。
【OpenAI APIでできること】
- テキスト生成
- 画像生成
- コード生成
- 音声認識と出力
- リアルタイムのレスポンス
- ナレッジ検索
- AIアシスタントの構築
OpenAI APIを使いこなせば、AIチャットボット・顧客向けAIサービス・AIエージェントなど、さまざまなAIツールを構築できます。自社の作業効率が向上するほか、顧客に新たな価値を提供できるので、ぜひ利用してみてください。
最後に
いかがだったでしょうか?
「OpenAI API」を活用すれば、24時間自動応答可能なチャットボットの構築や、自社独自のテイストに合わせた文章の自動生成が実現できます。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。