GPT-4とは?GPT-4の使い方や料金体系、GPT-3.5との違い、API、画像入力の方法を解説!
この記事では、2023年3月15日にリリースされたChatGPTの最新モデルであるGPT-4について書いています。
- GPT-4とは何か?
- 何ができるのか?
- GPT-4を使うには?
をわかりやすく説明します。
GPT-4は、GPT-3.5に比べて処理能力が大幅に向上した、大規模言語モデルです。テキスト生成、翻訳、コード作成、データ解析、質問への回答など、さまざまなタスクに使用できます。2024年2月現在の最新情報を元に解説しますので、ぜひ最後までご覧ください。
ChatGPTの最新モデル
GPT-4は、OpenAIが開発した最新の大規模言語モデルで、GPT-3.5に続く次世代モデルです。GPT-4は、テキスト生成AI「ChatGPT」の開発にも使用されています。GPT-4のスペックは、以下のとおりです。
- パラメーター数:100兆個
- 学習データ量:10兆トークン
- テキスト生成速度:1000ワード/秒
- 言語対応数:100言語
以下に、GPT-4のスペックを、GPT-3.5と比較した表を記載します。
項目 | GPT-4 | GPT-3.5 |
---|---|---|
パラメーター数 | 100兆個 | 1750億個 |
学習データ量 | 10兆トークン | 3410億トークン |
テキスト生成速度 | 1000ワード/秒 | 400ワード/秒 |
言語対応数 | 100言語 | 35言語 |
GPT-4はGPT3.5と比べて、パラメーター数や学習データ量が大幅に増加しています。これにより、GPT-4は、より高度なテキスト生成が可能になりました。
また2023年11月にはGPT-4の改良版であるGPT-4 Turboも発表されています。API経由で利用できるモデルで、他のGPTモデルとのスペックを比較すると以下のようになります。
GPT-4 Turbo | GPT-4 | |
---|---|---|
入力できる文章量 | 128,000トークン | 最大32,768トークン |
学習データの鮮度 | 2023年4月まで | 2021年9月まで |
API経由で入力できるデータ | テキスト+画像 | テキスト |
API経由で出力できるデータ | テキスト+画像&音声 | テキスト |
GPT-4と比較しても入力できる文章量が4倍になりマルチモーダルにも対応しているので、GPT-4をAPI経由で使う方に特にオススメです。
ChatGPTの最新モデルができること
GPT-4がGPT-3.5 からアップグレードした点はたくさんありますが、特に重要な2つをピックアップします。ChatGPTを活用するときの参考にお役立てください。
1. 画像入力に対応
言語だけではなく、画像データをAIに読み込ませることが可能になりました。例えば、次の写真を入力して「何が作れますか?」と質問ができ、「クレープやフレンチトーストが作れます」との回答が得られます。
GPT-4Vは、GPT-4の画像入力機能をさらに強化したバージョンです。GPT-4Vでは、以下の機能が追加されました。
- 画像の翻訳:画像を別の言語に翻訳する
- 画像の創作:テキストから画像を創作する
GPT-4Vは、画像の入力に対応したGPT-4の更なる進化形と言えます。画像を用いた対話機能も、GPT-4Vの特徴の1つです。
GPT-4Vの対話機能では画像を入力して、そして関連する質問ができます。例えば、旅行中に観光地の写真を撮って、それについてGPT-4Vと対話したり、冷蔵庫の中を撮影して夕食のメニューを考えることができるのです。
さらにアプリ版のChatGPTには描画ツールがあるので、画像の特定の部分を強調させることも可能です。例えば、画像の中の特定の人物や物について質問したい場合は、その部分を描画してGPT-4Vに入力することで、より正確な回答を得ることができます。
2. 従来モデルより性能が向上
アメリカの司法試験などをGPT-4 に受けさせた結果を以下に示します。
- GPT3.5 の場合:下位10%の成績
- GPT-4 の場合:上位10%の成績
かなりの好成績を叩き出してますね。
GPT-4が司法試験などで上位10%の成績を収めたことは、GPT-4が人間と同等のレベルで知識を理解し、問題を解決できることを示しています。これは、GPT-4がさまざまな分野で活用される可能性を大きく広げるものです。GPT-4の今後の活用が楽しみですね。
ChatGPT-4を使うには
「いち早く最新モデルを使いたい」というみなさま!GPT-4が搭載されているさまざまなサービスを簡単にまとめました。無料で試せるツールもあるので、興味がある方はぜひ触れてみてください。
有料版ChatGPT Plus
GPT-4は、おなじみのChatGPTにて用意されています。ただ利用可能なのは有料版のChatGPT Plusのみで、利用料金が月額$20かかります。
そして、3時間毎に50メッセージという制限付きです。
とはいえ課金すると、このようにGPT-3.5 とGPT-4 を選べるようになります。お試しあれ。
Tome
Tomeは、ドキュメントからPowerPointのようなプレゼン資料を自動で作成できるサービスです。
アカウント登録時にもらえる500クレジットがある間は、無料で使えます。Tomeは、プレゼンの準備に時間をかけたくない方や、プレゼン資料の作成に自信がない方におすすめです。音声入力で、台本を書いて思考を整理し、プレゼン資料を作れたらかなり生産性が高いかもしれませんね。
Tomeの音声入力機能がさらに便利になれば、プレゼン資料作成の効率化がさらに進み、より多くの人がプレゼン資料を活用できるようになるでしょう。気になる方は、まずは無料プランで試してみると良いかもしれません。
Be My Eyes
画像の入力ができることでさらにパワーアップした盲目の方向けアシスタントサービス。スマートフォンのカメラで周囲の様子を撮影し、アプリを通じて支援者(ボランティア)に映像を共有することで、支援者からの音声によるサポートを受けることができます。
この新機能により、盲目の方や視覚障害のある方は、スマートフォンで撮影した画像を支援者に送信。支援者は、画像を視覚的に確認して、盲目の方や視覚障害のある方の質問や要望に応じたサポートが提供できます。
Be My Eyesは、盲目の方や視覚障害のある方にとって、重要なツールになるでしょう。また、Be My Eyesは、障害者に対する理解を促進し、新たなテクノロジーの開発に貢献する可能性を秘めています。
Duolingo
世界一人気の語学アプリDuolingoが、OpenAI社のGPT-4を搭載したDuolingo Maxを公開しました。
Duolingo Maxは、Duolingoの有料プランであるSuper Duolingoの上位互換です。Duolingo Maxは、現在のところ、英語話者がフランス語またはスペイン語を学ぶ場合にのみ利用できます。
Duolingoは世界で最も人気の語学アプリです。そんなDuolingoのMaxが日本でも解放されれば、より多くの人が語学学習に活用するようになるでしょう。
日本で未対応なのは残念ですが、Duolingo Maxの今後の展開に期待ですね。
なお、GPT-4を格安で利用できる方法について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【Forefront AI】GPT-4やClaude 2、人気LLMをまとめて格安利用できるAIサービス
GPT-4 APIの利用方法や料金体系
GPT-4のリリースに伴い、GPT-4 APIも2023年7月6日に一般公開されています。この時点から、APIを通じてGPT-4の機能を他のアプリケーションやウェブサイトでも利用できるようになりました。
API(Application Programming Interface)とは、異なるソフトウェアやアプリケーションが互いに通信し、機能を共有するためのインターフェースです。
GPT-4 APIの利用方法
GPT-4 APIを利用するまでの手順は以下の通りです。
- OpenAIアカウントの作成
- GPT-4が利用できるか確認
- APIキーの取得
OpenAIアカウントの作成
まずは、OpenAIのウェブサイトでアカウントを作成します。既にアカウントを持っている方は、この手順は必要ありませんので「GPT-4が利用できるか確認」に進んでください。
真ん中の「Get started」をクリックするとアカウント作成に必要なフォームが表示されるので、必要情報を入力してアカウントを作成します。
メールアドレスのサインアップの他、GoogleアカウントかMicrosoftアカウントの認証などを利用できます。
パスワードや簡単な質問に回答する必要があるので、アナウンスに従って入力します。 サインアップには電話認証が必要になるので事前にSMSが利用可能な電話番号を用意して下さい。
GPT-4が利用できるか確認
次に、GPT-4が使えるか確認しましょう。
まずはOpenAI Platformにログインしてください。
その後、左のメニューから「Playground」を選択します。
右側の「Model」で「gpt-4」が選択できればGPT-4 APIが使用できます。
表示されない場合は、以下の記事を参考にしてみてください。
参考記事:ChatGPT GPT-4 APIを使用するのに苦労した話
APIキーの取得
最後にAPIキーの取得です。左のメニューから「API keys」を選択し、画面の中央にある「Create new secret key」をクリックします。
APIキーには任意で名前をつけることができます。入力が終わったら「Create secret key」をクリックします。
ちなみに名前を入力しなくても次に進むことはできます。
発行されたAPIキーはこのタイミングでのみ閲覧可能なので、安全な場所に保存します。
以上で、GPT-4 APIの利用準備が完了となります。お疲れ様でした。
GPT-4 APIの利用料金
GPT-4 APIは従量課金制で、使用量は「トークン」単位で計算されます。
テキスト解析・生成の最小単位のこと。英語では1単語が1トークンですが、日本語では1文字が約2〜3トークンに相当します。
また利用するモデルによってトークンあたりの金額が異なります。
例えば、日本語で「今日の天気はどうですか?」(12文字) と質問して、その回答が「晴れ時々曇りです。」(9文字) の場合以下のように計算されます。
日本語1文字を平均2.5トークンと仮定すると、
- 入力(プロンプト): 12文字 × 2.5トークン/文字 = 30トークン
- 出力(回答): 9文字 × 2.5トークン/文字 = 22.5トークン
となります。
次に、2024年2月時点での最新のgpt-4標準モデルの料金(入力0.03ドル/1000トークン、出力0.06ドル/1000トークン)を使用すると、以下のようになります。
- 入力料金: 30トークン × $0.03/1000トークン = $0.0009
- 出力料金: 27.5トークン × $0.06/1000トークン = $0.00135
- 合計: $0.00225
2024年2月21日の為替相場が1ドル=約150円ですので、日本円に換算すると、約0.34円になります。
ただし、実際のトークンの消費量は入力内容や文章の構造によって変わりますのでご注意ください。またAPI料金は変更される可能性もあるので、使用する際は最新情報をチェックするようにしましょう。
なお、ChatGPT APIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→ChatGPT APIとは?使い方や料金体系、できること、おすすめ活用事例15選を紹介
ChatGPTの最新モデル「GPT-4」を使いこなそう
ChatGPTの最新モデルであるGPT-4の概要と使い方を紹介させて頂きました。
GPT-4は、GPT-3.5に比べて大幅な性能向上を遂げた大規模言語モデルです。テキスト生成、翻訳、コード作成、データの解析、質問への回答など、さまざまなタスクに使用できる、非常に強力なツールです。
そしてGPT-4が搭載されているサービスは、まだ開発中のものも多く、今後もさらに進化していくことが期待されます。GPT-4をいち早く利用したい方は、ChatGPT(有料版)やTomeなどのサービスを試してみるのがおすすめです。
また、画像入力に対応したGPT-4の今後の活用にも注目です。GPT-4がさまざまな分野で活用されることで、私たちの生活はより便利で豊かになるでしょう。今後も最新情報を追いかけていきますので、引き続きご期待ください。
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
WEELの生成AIへのスタンス
ChatGPTやStable Diffusionなど使い勝手の良いAIサービスは沢山あります。そういったもの1度使ってみて、もっとこうしたい、こう言った使い方をしたいと言った方に向けてカスタマイズを勧めております。
もし、自社で生成AIを活用したいという場合は
1. 汎用的な生成AIツールを導入し、定着させる
2. 業務を生成AIに解けるタスクまで分解し、自動化する
のどちらかが良いと思います。
弊社では
1の場合、生成AIセミナーの実施や生成AIコンサルティングなどで、AI専門家による生成AI活用指導
2の場合、PoC開発やソリューション開発などで、LLMエンジニアやAIコンサルタントが御社にあったAIツールの開発を行います。
無料相談にてご相談を承っておりますので、興味がある方は以下からご連絡ください。
→無料相談で話してみる
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。