【GPT-5.2】SWEベンチで新記録を樹立!OpenAIコードレッド宣言後に登場した大規模言語モデルを徹底解説

GPT-5.2 SWE ベンチ 新記録 樹立 OpenAI コードレッド 宣言後 登場 大規模言語モデル 徹底 解説
押さえておきたいポイント
  • Gemini 3への対抗策として、「コードレッド」を宣言し、開発が急ピッチで進められた大規模言語モデル
  • 知性やコード処理、長文理解などの性能が向上、特に、スプレッドシート作成やプレゼン資料作成、複雑な多段階タスクに強みを発揮
  • Python限定のSWE-Bench Verifiedでは80.0%と新記録を樹立

2025年12月12日、OpenAIは、大規模言語モデルの最新バージョン「GPT-5.2」を公開しました!

従来のGPT-5シリーズをアップグレードしたもので、競合するGoogleのGemini 3への対抗策として、社内で「コードレッド」を宣言し、開発が急ピッチで進められた経緯があるようです。

GPT-5.2は、知性やコード処理、長文理解などの性能が向上していて、特に、スプレッドシート作成やプレゼン資料作成、複雑な多段階タスクに強みを発揮するとOpenAIは説明しています。

今回の記事では、GPT-5.2の特徴・性能・ライセンス・使い方を詳しく解説します。

ぜひ最後までご覧ください!

\生成AIを活用して業務プロセスを自動化/

目次

GPT-5.2の概要

GPT-5.2の概要
参考:https://openai.com/ja-JP/index/introducing-gpt-5-2/

GPT-5.2は、「GPT-5.2 Instant」「GPT-5.2 Thinking」「GPT-5.2 Pro」という3つのモデルで構成されています。

Instantは、日常的な質問や翻訳、簡単な調べものなどのタスクを高速に処理し、GPT-5.1で導入された会話調の温かみある対話スタイルをキープしつつ、情報探索やHowTo解説、技術文書のライティングなどにおいて、明確さが増しています。

Thinkingは、より高度な推論・解析が必要なタスク向けで、公式によると、スプレッドシートのフォーマット作成や資料作成などが大幅に改善されています。

Proは、Proプラン限定の最上位モデルで、より難易度の高い質問に対して最高品質の回答を目指してくれます。

OpenAIの評価では、Proは従来モデルより重大な誤りが少なく、プログラミングなど複雑な領域での性能がさらに強化されているとのことです。

なお、すべてのGPT-5.2モデルは、知識カットオフが2025年8月に更新されていて、それ以前のモデルよりも最新の情報に対応しています。

GPT-5.2の性能

OpenAIによると、GPT-5.2 Thinkingは、「GDPval」というビジネス知識作業のベンチマークで70.9%のスコアを達成し、従来のGPT-5(38.8%)から大きく性能アップがなされています。

GPT-5.2の性能
参考:https://openai.com/ja-JP/index/introducing-gpt-5-2/

これは、営業プレゼンや会計スプレッドシートなど、実務タスクの正答率が飛躍的に向上したことを意味しています。

また、同評価では、GPT-5.2は専門家に比べて約11倍速い処理速度で結果を生成し、コストは1%以下に抑えられていることも報告されていて、業務効率化への貢献が期待できそうです。

コーディング能力も強化されていて、GPT-5.2 Thinkingは、複数言語で出題されるSWE-Bench Pro(実務的ソフトウェア工学タスク)で55.6%というハイスコアを達成しています。

SWE-Bench-Pro(公開版)_ソフトウェアエンジニアリング-1
参考:https://openai.com/ja-JP/index/introducing-gpt-5-2/

Python限定のSWE-Bench Verifiedでは80.0%と新記録を樹立しており、バグ修正や機能実装など、日常的な開発作業で高い信頼性を誇っています。

加えて、GPT-5.2 Thinkingは、長文・長文脈理解にも強化が見られていて、256kトークン(数10万字ほど)に及ぶ長文共参照解決タスクで約100%の正答率を実現しています。

信頼性の面では、従来モデルに比べて、誤情報(ハルシネーション)発生率が30%低減したことが報告されており、リサーチや分析用途での精度が向上しています。

まとめると、GPT-5.2は、コーディング、文書生成、推論など幅広い分野で性能を大きく底上げしており、GPT-5シリーズのなかで最も賢く有用なモデルとなっています。

なお、従来モデル「GPT-5.1」について詳しく知りたい方は、以下の記事も参考にしてみてください。

GPT-5.2のライセンス

GPT-5.2はOpenAIの利用規約に従って利用する必要があり、われわれユーザーは出力自体は自由に利用できて、商用利用も認められています

一方で、モデル自体の改変や再配布は禁止されています。

つまり、GPT-5.2そのもののソースコードや重みを他者に配布することはできません。また、OpenAIは特許のライセンスを明示的には提供していないため、モデル技術そのものの特許利用も認められていません。

利用用途可否
商用利用⭕️
改変❌️
配布❌️
特許使用❌️
私的使用⭕️
GPT-5.2のライセンス

GPT-5.2の料金

GPT-5.2を利用するための料金は、利用形態(ChatGPTサービスを使うか、APIを使うか)やプランによって異なります。

一般向けには、ChatGPTの有料プラン加入者から無料プランまで、段階的にサービスが提供されています。

まずは、ChatGPTの有料ユーザー(Plus、Pro、Businessプランなど)に優先的に提供開始され、その後無料ユーザーにも順次開放されていくと発表されています。

スクロールできます
プラン料金(税込)
無料
Plus$20/月(約¥2,700)
Pro$200/月(約¥30,000)​
Business要問い合わせ
Enterprise要問い合わせ (カスタム契約)
ChatGPTの料金表

2025年12月12日時点のAPI利用料については、GPT-5.2 Instantが100万入力トークンあたり1.75ドル100万出力トークンあたり14ドルとなっています。

GPT-5.2の料金は、従来モデルのGPT-5.1に比べてやや高く設定されていますが、その分性能が向上していて、他社の最先端モデルよりは低価格に抑えられています。

GPT-5.2の使い方

GPT-5.2を利用するには、ChatGPTでの利用、API経由での利用の大きく2パターンがあります。

ChatGPTでの利用

まずはChatGPTの公式サイト(chat.openai.com)または公式アプリを開きます。

ChatGPTの有料プラン(Plus、Pro、Go、Business、Enterprise)に加入している場合、GPT-5.2(Instant/Thinking/Pro)が優先的に利用可能です。OpenAI発表によれば、2025年12月12日以降、有料プランから順次GPT-5.2がロールアウトされます。

ChatGPTのチャット画面上部にあるモデル選択メニューを開き、GPT-5.2モデルを確認します。

上記の画像のように、「GPT-5.2 Auto」(自動切替)、「GPT-5.2 Instant」、「GPT-5.2 Thinking」、「GPT-5.2 Pro」といった選択肢が表示されているはずです。

通常は「Auto(自動)」にしておけば、質問内容に応じてシステムが適切なモデル(InstantまたはThinking)を選択してくれます。もし手動で切り替えたい場合は、ドロップダウンからInstantまたはThinkingを選択すれば、そのモードで回答が生成されます。Instantは日常的な簡単な質問向け、Thinkingは高度な計算や複雑なタスク向けというイメージです。

(参考)APIで利用する

開発者向けとして、OpenAIのAPIを通じてGPT-5.2を利用することもできます。

まず、OpenAIの開発者用ダッシュボードでAPIキーを取得し、適切なバージョンのエンドポイントを呼び出す必要があります。

モデル名は、GPT-5.2 Instantがgpt-5.2-chat-latest、GPT-5.2 Thinkingがgpt-5.2、GPT-5.2 Proがgpt-5.2-proです。

これらをモデルIDとして、HTTPリクエストに含めると、GPT-5.2からJSON形式のレスポンスが返ってきます。使用時はトークン数を考慮しつつ、Instant/Thinking/Proを用途に応じて使い分けるとよいかと思います。

GPT-5.2を使ってみた

それでは、実際にGPT-5.2-Thinkingモデルに、いくつかのタスクを処理してもらいましょう。

スプレッドシート作成

ひとまず、雑に以下のプロンプトで試してみます。

四半期の売上分析スプレッドシートを作成して

実行時間は13分ほど、実行結果は以下の通りでした。

「使い方」「入力」「集計」「ダッシュボード」の4シートが作成され、各所に最適な関数やフィルタ機能も実装されていました。

もう少し出力までの時間が早いとベストですが、雑なプロンプトからこの出力をワンショットで出してくれるのはかなりの好感触です!

コーディング

続いて、ゲーム生成タスクを通して、コーディング性能も試してみましょう。

以下の要件を満たすシングルページアプリを1つの HTML ファイルで作成してください。
- 名前:Typing Word
- 目標:落ちてくる単語が下に到達する前にタイプすること。
- 機能:難易度上昇、正確性トラッカー、スコア、日本語。
- UI は東京の街並み背景で、流れ星のように単語が落ちてくるアニメーションを使用してください。

2分ほどで約1,400行ものコードを書いてくれました。

ゲーム概要やルールまで反映してくれています。

入力したあとに単語を撃破する要素が欲しいところですが、ワンショットでこのクオリティのゲームを生成してくれました。

コーディングタスクに関しては、生成スピード、クオリティともに言う事がない結果となりました。

みなさんも、ご自身のタスクでぜひ試してみてください!

まとめ

GPT-5.2は、GPT-5シリーズの最新アップデートで、知性やコード処理、長文理解などの性能が大幅に強化されています。特に、スプレッドシート作成やプレゼン資料作成、複雑な多段階タスクにおいて、強みを発揮してくれます。

これまで以上に実用的なGPT-5.2を、ぜひ活用してみてください。

最後に

いかがだったでしょうか?

弊社では、AI導入を検討中の企業向けに、業務効率化や新しい価値創出を支援する情報提供・導入支援を行っています。最新のAIを活用し、効率的な業務改善や高度な分析が可能です。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

大規模言語モデル(LLM)比較レポート
LLM比較レポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

投稿者

  • WEEL Media部

    株式会社WEELが運営する生成系AI関連メディア「生成AI Media」は、AIの専門家によるWebメディアです。 AIに特化した編集部がAIの活用方法、導入事例、ニュース、トレンド情報を発信しています。

  • URLをコピーしました!
  • URLをコピーしました!
目次