GPT-4とは?GPT-4の使い方や料金体系、GPT-3.5やGPT-4oとの違い、API、画像入力の方法を解説!

この記事では、2023年3月15日にリリースされたChatGPTのモデルのひとつであるGPT-4についてご紹介します。
- GPT-4とは何か?
- 何ができるのか?
- GPT-4を使うには?
をわかりやすく説明します。
GPT-4は、GPT-3.5に比べて処理能力が大幅に向上した大規模言語モデルです。テキスト生成、翻訳、コード作成、データ解析、質問への回答など、さまざまなタスクに使用できます。2025年2月現在の最新情報を元に解説しますので、ぜひ最後までご覧ください。
ChatGPTのGPT-4モデルの概要
GPT-4は、OpenAIが開発した大規模言語モデルで、GPT-3.5に続く次世代モデルです。GPT-4は、テキスト生成AI「ChatGPT」の開発にも使用されています。
GPT-4のスペックは、以下のとおりです。
- パラメーター数:100兆個
- 学習データ量:10兆トークン
- テキスト生成速度:1000ワード/秒
- 言語対応数:100言語
以下に、GPT-4のスペックを、GPT-3.5と比較した表を記載します。
項目 | GPT-4 | GPT-3.5 |
---|---|---|
パラメーター数 | 100兆個 | 1750億個 |
学習データ量 | 10兆トークン | 3410億トークン |
テキスト生成速度 | 1000ワード/秒 | 400ワード/秒 |
言語対応数 | 100言語 | 35言語 |
GPT-4はGPT3.5と比べて、パラメーター数や学習データ量が大幅に増加しています。これにより、GPT-4は、より高度なテキスト生成が可能になりました。
また2024年5月にはGPT-4の改良版であるGPT-4 Turboも発表されています。API経由で利用できるモデルで、他のGPTモデルとのスペックを比較すると以下のようになります。
GPT-4 Turbo | GPT-4 | |
---|---|---|
入力できる文章量 | 128,000トークン | 最大32,768トークン |
学習データの鮮度 | 2023年4月まで | 2021年9月まで |
API経由で入力できるデータ | テキスト+画像 | テキスト |
API経由で出力できるデータ | テキスト+画像&音声 | テキスト |
GPT-4と比較しても入力できる文章量が4倍になりマルチモーダルにも対応しているので、GPT-4をAPI経由で使う方に特にオススメです。
さらに、2024年5月にはGPT-4の性能を向上させた最新版「GPT-4o」が登場し、2025年2月現在では、一部利用制限はあるものの無料版ChatGPTでもGPT-4oを利用できます。
利用制限がかかった場合はGPT-3.5の利用になりますが、高性能な最新モデルのGPT-4oを利用したい方は、ぜひ試してみてください。
なお、GPT-4oについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

GPT-4でできるようになったこと
GPT-4がGPT-3.5 からアップグレードした点はたくさんありますが、特に重要な2つをピックアップします。ChatGPTを活用するときの参考にお役立てください。
1. 画像入力に対応
言語だけではなく、画像データをAIに読み込ませることが可能になりました。例えば、次の写真を入力して「何が作れますか?」と質問ができ、「クレープやフレンチトーストが作れます」との回答が得られます。

GPT-4Vは、GPT-4の画像入力機能をさらに強化したバージョンです。GPT-4Vでは、以下の機能が追加されました。
- 画像の翻訳:画像を別の言語に翻訳する
- 画像の創作:テキストから画像を創作する
GPT-4Vは、画像の入力に対応したGPT-4の更なる進化形と言えます。画像を用いた対話機能も、GPT-4Vの特徴の1つです。
GPT-4Vの対話機能では画像を入力して、そして関連する質問ができます。例えば、旅行中に観光地の写真を撮って、それについてGPT-4Vと対話したり、冷蔵庫の中を撮影して夕食のメニューを考えることができるのです。
さらにアプリ版のChatGPTには描画ツールがあるので、画像の特定の部分を強調させることも可能です。
例えば、画像の中の特定の人物や物について質問したい場合は、その部分を描画してGPT-4Vに入力することで、より正確な回答を得ることができます。
2. 従来モデルより性能が向上
アメリカの司法試験などをGPT-4 に受けさせた結果を以下に示します。

- GPT3.5 の場合:下位10%の成績
- GPT-4 の場合:上位10%の成績
かなりの好成績を叩き出してますね。
GPT-4が司法試験などで上位10%の成績を収めたことは、GPT-4が人間と同等のレベルで知識を理解し、問題を解決できることを示しています。これは、GPT-4がさまざまな分野で活用される可能性を大きく広げるものです。GPT-4の今後の活用が楽しみですね。
GPT-4の日本語特化モデルが登場
2024年4月15日、ついにOpenAIが日本語特化で最適化を施した、GPT-4のカスタムモデルを発表しました。
日本語特化モデルの特徴は、
● 無印GPT-4比で、日本語の処理速度が3倍にUP
● 日本語使用時の消費トークン数が減少、コスト47%減
と、国内の全ChatGPTユーザーが歓喜する仕様になっています。
OpenAI公式のポストを見ても分かる通り、日本語での出力スピードが早く、内容もより細かい情報が出力できるようになったのが特徴といえるでしょう。
日本支部「OpenAI Japan」も始動
OpenAIは日本語特化版GPT-4と並行して、同社の日本支部「OpenAI Japan」の立ち上げを発表しました。
なんと、アジア初のオフィスが日本にできるとのことなので、こちらについても詳細をみていきましょう。
OpenAI Japanのオフィスは東京
2024年4月15日、OpenAIは日本支部「OpenAI Japan」の立ち上げも発表しています。
そしてアジア初となるオフィスは、
日本の政治・技術・イノベーションの中心、弊社WEELも本拠地を構える「東京」
に設立することを明らかにしました。
際してCEOのサム・アルトマンは、
との旨を述べています。これで弊社スタッフもサム・アルトマンに会える……かも!
社長は元AWSジャパンの長﨑忠雄氏
OpenAI Japanの社長には、元・AWSジャパン社長の「長﨑忠雄」氏が就任します。
この長﨑忠雄 氏は「日本のクラウド市場の立役者」ともいえるビッグネームで……
OpenAI Japan社長・長﨑忠雄氏の経歴
- 世界No.1のクラウドベンダーAWSの日本支部「AWSジャパン」元社長
- 人事異動の激しい外資系企業・AWSジャパンで12年7ヶ月も社長を継続
- 米国本社から日本市場へ2兆2600億円の投資を実現
というふうに、AWS時代から辣腕を振るってきました。
そんな百戦錬磨の社長を抱えるOpenAI Japanなら、「生成AI先進国・日本」が実現するかもしれませんね。※2、3
OpenAI Japan発足の理由
生成AIブームのトップランナーOpenAIがここまで日本に熱視線を向ける理由は、何なのでしょうか?
答えは今回の発表で出ています。OpenAIによると日本は……
- 主要企業がChatGPT導入済み
- 行政もChatGPTに積極的
- G7広島AIプロセスの主役
の3点から、アジアでの本拠地に選ばれたとのこと。以下にて、それぞれ詳しくみていきましょう!
理由1.主要企業がChatGPT導入済み
OpenAI曰く、日本企業は世界的にみてもChatGPTをよく活用しているそう。
確かに……
【ChatGPT Enterprise導入済み】
- ダイキン
- 楽天
- トヨタコネクテッド
…etc.
【ChatGPT API+Azure OpenAI Service導入済み】
- パナソニック コネクト
- アサヒビール
- 日清
…etc.
などなど名だたる企業が、ChatGPTやそれに類するサービスを導入しています。ついに国内ユーザーの声がOpenAIに届いたというわけですね。
理由2.行政もChatGPTに積極的
地方自治体・行政がChatGPTに積極的であったことも、OpenAI日本進出の決め手です。
その筆頭は導入後1年間で……
- 約半数の職員が実際にChatGPTを活用
- ChatGPTについて、約8割の職員が「仕事の効率が上がる」と回答
などなど業務効率化を達成した横須賀市成功をきっかけに、東京都・神戸市等の自治体へとChatGPT活用の輪が広まっています。※4
理由3.G7広島AIプロセスの主役
最後にOpenAIが日本に注目する理由として、「G7広島AIプロセス」が挙げられます。※5
G7広島AIプロセスは、2023年に日本が先導してG7で合意に至った取り組みで、
要約すると……
生成AIとうまく付き合っていくためのルール・指針作り
です。そう、イタリア等各国が生成AIを頭ごなしに規制する中、日本は「生成AI時代のメートル原器」を率先して作っているんです。
ChatGPT-4を使うには
GPT-4が搭載されているさまざまなサービスを簡単にまとめました。無料で試せるツールもあるので、興味がある方はぜひ触れてみてください。
有料版ChatGPT
GPT-4は、おなじみのChatGPTにて用意されています。ただ利用可能なのは有料版のChatGPTのみで、利用料金が最低でも月額$20かかります。

2025年2月現在では、有料版ChatGPTを利用している方は「GPT-4o」「o1」「o3-mini」「o3-mini-high」「GPT-40 mini」「GPT-4」の6つのモデルを利用できます。
また、無料版ChatGPTにおいても制限付きではありますが、「GPT-4o」の利用が可能です。
Tome
Tomeは、ドキュメントからPowerPointのようなプレゼン資料を自動で作成できるサービスです。
アカウント登録時にもらえる500クレジットがある間は、無料で使えます。Tomeは、プレゼンの準備に時間をかけたくない方や、プレゼン資料の作成に自信がない方におすすめです。音声入力で、台本を書いて思考を整理し、プレゼン資料を作れたらかなり生産性が高いかもしれませんね。
Tomeの音声入力機能がさらに便利になれば、プレゼン資料作成の効率化がさらに進み、より多くの人がプレゼン資料を活用できるようになるでしょう。気になる方は、まずは無料プランで試してみると良いかもしれません。
Be My Eyes
画像の入力ができることでさらにパワーアップした盲目の方向けアシスタントサービス。スマートフォンのカメラで周囲の様子を撮影し、アプリを通じて支援者(ボランティア)に映像を共有することで、支援者からの音声によるサポートを受けることができます。
この新機能により、盲目の方や視覚障害のある方は、スマートフォンで撮影した画像を支援者に送信。支援者は、画像を視覚的に確認して、盲目の方や視覚障害のある方の質問や要望に応じたサポートが提供できます。
Be My Eyesは、盲目の方や視覚障害のある方にとって、重要なツールになるでしょう。また、Be My Eyesは、障害者に対する理解を促進し、新たなテクノロジーの開発に貢献する可能性を秘めています。
Duolingo
世界一人気の語学アプリDuolingoが、OpenAI社のGPT-4を搭載したDuolingo Maxを公開しました。
Duolingo Maxは、Duolingoの有料プランであるSuper Duolingoの上位互換です。Duolingo Maxは、現在のところ、英語やフランス語などを含む8か国語を学習できます。
なお、GPT-4を格安で利用できる方法について詳しく知りたい方は、下記の記事を合わせてご確認ください。

GPT-4 APIの利用方法や料金体系
GPT-4のリリースに伴い、GPT-4 APIも一般公開されています。この時点から、APIを通じてGPT-4の機能を他のアプリケーションやウェブサイトでも利用できるようになりました。
API(Application Programming Interface)とは、異なるソフトウェアやアプリケーションが互いに通信し、機能を共有するためのインターフェースです。
GPT-4 APIの利用方法
GPT-4 APIを利用するまでの手順は以下の通りです。
- OpenAIアカウントの作成
- GPT-4が利用できるか確認
- APIキーの取得
OpenAIアカウントの作成

まずは、OpenAIのウェブサイトでアカウントを作成します。既にアカウントを持っている方は、この手順は必要ありませんので「GPT-4が利用できるか確認」に進んでください。
真ん中の「Get started」をクリックするとアカウント作成に必要なフォームが表示されるので、必要情報を入力してアカウントを作成します。

メールアドレスのサインアップの他、GoogleアカウントかMicrosoftアカウントの認証などを利用できます。
パスワードや簡単な質問に回答する必要があるので、アナウンスに従って入力します。 サインアップには電話認証が必要になるので事前にSMSが利用可能な電話番号を用意して下さい。
GPT-4が利用できるか確認
次に、GPT-4が使えるか確認しましょう。
まずはOpenAI Platformにログインしてください。

その後、左のメニューから「Playground」を選択します。

右側の「Model」で「gpt-4」が選択できればGPT-4 APIが使用できます。

APIキーの取得
最後にAPIキーの取得です。左のメニューから「API keys」を選択し、画面の中央にある「Create new secret key」をクリックします。

APIキーには任意で名前をつけることができます。入力が終わったら「Create secret key」をクリックします。
ちなみに名前を入力しなくても次に進むことはできます。

発行されたAPIキーはこのタイミングでのみ閲覧可能なので、安全な場所に保存します。

以上で、GPT-4 APIの利用準備が完了となります。お疲れ様でした。
GPT-4 APIの利用料金
GPT-4 APIは従量課金制で、使用量は「トークン」単位で計算されます。
テキスト解析・生成の最小単位のこと。英語では1単語が1トークンですが、日本語では1文字が約2〜3トークンに相当します。
また利用するモデルによってトークンあたりの金額が異なります。

例えば、日本語で「今日の天気はどうですか?」(12文字) と質問して、その回答が「晴れ時々曇りです。」(9文字) の場合以下のように計算されます。
日本語1文字を平均2.5トークンと仮定すると、
- 入力(プロンプト): 12文字 × 2.5トークン/文字 = 30トークン
- 出力(回答): 9文字 × 2.5トークン/文字 = 22.5トークン
となります。
次に、2025年2月時点でのGPT-4モデルの料金(入力0.03ドル/1000トークン、出力0.06ドル/1000トークン)を使用すると、以下のようになります。
- 入力料金: 30トークン × 0.03ドル/1000トークン = $0.0009
- 出力料金: 22.5トークン × 0.06ドル/1000トークン = $0.00135
- 合計: $0.00225
2025年2月の為替相場が1ドル=約150円ですので、日本円に換算すると約0.34円になります。
また、最新のGPT-4oモデル(入力0.01ドル/1000トークン、出力0.005ドル/1000トークン)を使用した場合、
- 入力料金: 30トークン × 0.01ドル/1000トークン = 0.0003ドル
- 出力料金: 22.5トークン × 0.005ドル/1000トークン = 0.0001125ドル
- 合計: 0.0004125ドル
となり、日本円に換算すると0.06円という計算になります。このように、2025年2月時点においては、最新のGPT-4oの方が低価格かつ高性能なので、API利用するならGPT-4oがおすすめです。
ただし、実際のトークンの消費量は入力内容や文章の構造によって変わりますのでご注意ください。またAPI料金は変更される可能性もあるので、使用する際は最新情報をチェックするようにしましょう。
ChatGPTの商用利用について
ChatGPTを運営しているOpenAIの利用規約によると、「ChatGPTに生成されたコンテンツのすべての権利および利益は作成者にある」と明記されているため、ChatGPTから出力した情報は商用利用が可能です。
しかし、出力された情報の中に著作権やプライバシーの侵害に該当する内容が含まれている可能性があるため、最悪の場合法的な問題に発展する可能性もあります。
そのため、ChatGPTから出力されたコンテンツを商用利用する場合は、必ず公開前にチェックしましょう。
なお、ChatGPTの著作権問題について詳しく知りたい方は、下記の記事を合わせてご確認ください。

ChatGPTの料金プラン
現在ChatGPTでは、無料プランの他に4種類の有料プランが用意されています。
それぞれのプラン料金や特徴は下記の通りです。
プラン名 | 料金 | 特徴 |
---|---|---|
Plus | 20ドル/月 | ・プラグインやGPTsが利用可能 |
Pro | 200ドル/月 | ・高度な音声モードが利用可能・OpenAI o1 pro modeが利用可能 |
Team | ユーザー1人あたり30ドル/月 | ・チームで利用できるため、各ツールの利用上限が高い・ワークスペースの共有が可能 |
Enterprise | 企業規模で変動 | ・GPTの速度が通常の2倍・文字数制限が通常の4倍 |
基本的には、Plusプランに加入することでほぼ全ての機能が利用できますが、Proプランに加入することでPlusプランで制限のある項目が無制限になったり最新モデルがいち早く利用できるようになります。
予算次第ではありますが、ChatGPTを最大限に活用したい方はProプランへの加入も検討することをおすすめします。
最新モデルであるGPT-4oの活用方法
最後に、最新モデルであるGPT-4oの活用方法についてご紹介します。
事例①写真からの領収書仕分け
GPT-4oは画像からの情報を正確に判断することができます。
例えば、上記のポストのように、領収書画像を読み込ませることで購入した商品別の値段や税区分の違い、支払い方法などの情報を細かく抽出することができます。
また、入力プロンプト次第では欲しい情報だけ抽出できるので、家計簿や経費計算など領収書やレシート情報をまとめる時に便利でしょう。
事例②画像からHTMLを書き起こす
GPT-4oの画像認識能力と理解力を駆使すれば、画像データからHTMLを書き起こすことができます。
例えば、上記のポストのように、作成したいイメージとプロンプトを手書きで書いた画像をGPT-4oにアップロードすることで、自動でイメージに沿ったHTMLを作成することができます。
この機能を活用すれば、プログラミング知識がないユーザーでも、簡単にサイトデザインを思い通りに作成することができるでしょう。
事例③漫画の内容を解読
画像やテキストから内容を把握できるGPT-4oに、漫画の画像を読み込ませることで簡単に解読することができます。
上記ポストのように一部セリフは抜けてしまっているものの、一コマずつの登場人物や場面などをしっかり認識し、場面を詳しく読み取ることができています。
今回ご紹介したのは漫画を読み込んだ結果でしたが、提案資料や会社説明資料などといった書類でも同様に画像データから必要な情報を抽出することもできるでしょう。
なお、GPT-4oの活用事例について詳しく知りたい方は、下記の記事を合わせてご確認ください。

GPT-4を使いこなそう
今回はGPT-4の概要と使い方を紹介させて頂きました。
GPT-4は、GPT-3.5に比べて大幅な性能向上を遂げた大規模言語モデルです。テキスト生成、翻訳、コード作成、データの解析、質問への回答など、さまざまなタスクに使用できる、非常に強力なツールです。
そしてGPT-4が搭載されているサービスは、まだ開発中のものも多く、今後もさらに進化していくことが期待されます。GPT-4を利用したい方は、ChatGPT(有料版)やTomeなどのサービスを試してみるのがおすすめです。
また、画像入力に対応したGPT-4の今後の活用にも注目です。GPT-4がさまざまな分野で活用されることで、私たちの生活はより便利で豊かになるでしょう。

生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
GPT-4の導入を検討しているなら、最新のモデル特性や活用方法を把握し、貴社に最適な運用方法を見極めることが重要です。専門家の視点から、具体的な導入戦略をご提案します。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、サービス紹介資料もご用意しておりますので、併せてご確認ください。