まさかの人間越え!?GPT-5.4とは?PC自動操作・105万トークン対応モデルを徹底解説

- OpenAIの「プロフェッショナルな業務に最適化された、最も高性能かつ効率的なフロンティアモデル」と位置づけられたモデル
- 通常版に加え推論特化のGPT-5.4 Thinking、最高性能を発揮するGPT-5.4 Proの3バリエーション構成で登場
- OpenAI初となるネイティブ・コンピュータ操作(Computer Use)機能を搭載
2026年3月6日、OpenAIはGPTシリーズの最新フラッグシップモデル「GPT-5.4」をリリースしました!
「プロフェッショナルな業務に最適化された、最も高性能かつ効率的なフロンティアモデル」と位置づけられた本モデルは、通常版に加えて推論特化のGPT-5.4 Thinking、さらに最高性能を発揮するGPT-5.4 Proの3バリエーション構成で登場しています。
最大の注目ポイントとしては、OpenAI初となるネイティブ・コンピュータ操作(Computer Use)機能の搭載です。AIが実際にマウスやキーボードを操り、アプリケーションを横断して複雑なタスクをこなせるとのこと。
そこで本記事では、GPT-5.4の概要から技術的な仕組み、ベンチマーク性能、具体的な使い方・活用シーンまでを徹底的に解説していきます。
ぜひ最後までご覧ください!
\生成AIを活用して業務プロセスを自動化/
GPT-5.4とは?

GPT-5.4は、OpenAIが2026年3月6日に発表した大規模言語モデルで、「複雑なプロフェッショナル業務に特化したフロンティアモデル」として開発されました。前世代のGPT-5.2と比較して、個々の主張におけるエラーが33%減少し、応答全体でのエラー含有率も18%低下するなど、正確性が大幅に向上しています。

モデルは3つのバリエーションで提供されます。標準版のGPT-5.4は、汎用的なテキスト生成やコード生成に対応し、GPT-5.4 Thinkingは、内部推論プロセスを活用した深い思考を行う推論特化版です。そしてGPT-5.4 Proは、最大限の計算リソースを投入して最も高い精度を実現するプレミアム版となっています。
注目すべきポイントは、OpenAIの汎用モデルとしては初めて搭載されたネイティブ・コンピュータ操作機能です。
GPT-5.4は、スクリーンショットを認識しながら、マウスクリックやキーボード入力、さらにはPlaywrightなどのライブラリを用いたコード実行によって、複数のアプリケーションを横断するマルチステップのワークフローを自律的に遂行することができます。
加えて、ChatGPTに直接統合されるMicrosoft ExcelおよびGoogle Sheetsプラグインも同時にリリースされていて、スプレッドシート上での高度なデータ分析や自動タスク処理が可能になりました。
APIでのコンテキストウィンドウは、最大約105万トークンに対応しており、これはOpenAI史上最大の処理能力です。さらに、ChatGPT Plusユーザー(月額20ドル〜)はGPT-5.4 Thinkingを、ChatGPT Proユーザー(月額200ドル)はGPT-5.4 Proを利用でき、CodexやAPIからも全バリエーションにアクセスすることができます。
なお、GPT-5.3-Codex-Sparkについて、詳しく知りたい方は以下の記事も参考にしてみてください。

GPT-5.4の仕組み
GPT-5.4がなぜここまで高い性能を発揮できるのか、その技術的な背景を見ていきましょう。

GPT-5シリーズは、Sparse Mixture-of-Experts(スパースMoE)アーキテクチャを採用しています。これはモデル全体で膨大なパラメータを保持しつつも、各クエリに対しては関連性の高い「エキスパート」サブモデルだけを選択的に活性化させる仕組みです。
コーディングの質問にはコード生成に特化したエキスパートが、画像に関する質問には視覚推論エキスパートが動的にルーティングされるため、全パラメータを毎回起動する必要がなく、高い精度と効率性を両立しています。
アテンション機構には、Group Query Attention(GQA)とスライディングウィンドウアテンションが併用されており、最大105万トークンという超長文コンテキストの推論を効率的に処理できます。
さらにGPT-5.4では、新たにツールサーチ(Tool Search)という仕組みが導入されました。従来はAPIコール時にすべてのツール定義を事前にロードする必要がありましたが、ツールサーチでは軽量なツールリストのみを受け取り、必要に応じてフル定義をオンデマンドで参照します。36のMCPサーバーを使った250タスクのテストでは、精度を維持したままトークン消費量を47%削減することに成功しています。
GPT-5.4の特徴
GPT-5.4の1番際立っている特徴は、コンピュータ操作ベンチマークで人間の性能を超えたという点です。デスクトップ操作を評価するOSWorld-Verifiedでは、GPT-5.4 Thinkingは75.0を記録しました。これは人間のベースライン(72.4%)を上回り、前世代のGPT-5.2(47.3%)からは28ポイント近い飛躍的な向上です。

プロフェッショナルな知識労働を評価するGDPvalでは、44の職種にわたるタスクで83.0%という新記録を達成しています。

特に、投資銀行のジュニアアナリストが行うようなスプレッドシートモデリングタスクでは87.3%(GPT-5.2は68.4%)と、実務レベルの業務処理能力を示しました。
コーディング性能においてもSWE-Bench Proで57.7%を記録し、Gemini 3.1 Pro(54.2%)を上回っています。また、人間の評価者によるプレゼンテーション品質の比較では、68%のケースでGPT-5.4が好まれたという結果も報告されています。視覚推論のMMMU-Proでも81.2%を達成し、マルチモーダル性能の高さも証明されました。
なお、Gemini 3.1 Proについて、詳しく知りたい方は以下の記事も参考にしてみてください。

GPT-5.4の安全性・制約
高性能なモデルだからこそ、安全性への配慮は極めて重要です。OpenAIがGPT-5.4に適用している安全対策を確認しておきましょう。
GPT-5.4には、GPT-5シリーズで導入された「Safe-Completion(セーフコンプリーション)」と呼ばれる安全性トレーニング手法が適用されています。
従来のモデルが「危険な入力を検知して応答を拒否する」アプローチだったのに対し、Safe-Completionでは出力そのものの安全性に焦点を当てています。ポストトレーニング段階で、OpenAIの安全ポリシーに違反する応答に対して、違反の深刻度に応じたペナルティを報酬モデルに組み込むことで、ユーザーの正当なリクエストにはなるべく応えつつ、有害な出力を抑制するバランスを取っています。
GPT-5.4の料金
GPT-5.4のAPI利用料金は、モデルバリエーションによって大きく異なります。
標準版のGPT-5.4はコストパフォーマンスに優れ、幅広い業務に対応できます。一方、GPT-5.4 Proは入出力ともにプレミアム価格が設定されていますが、BrowseCompやARC-AGI-2などのベンチマークで最高スコアを記録しており、精度が最優先される高度な業務に向いています。
| モデル | 入力(100万トークンあたり) | キャッシュ入力 | 出力(100万トークンあたり) |
|---|---|---|---|
| gpt-5.4 | $2.50 | $0.25 | $15.00 |
| gpt-5.4-pro | $30.00 | — | $180.00 |
ChatGPTのサブスクリプションとしては、Plusプラン(月額20ドル)でGPT-5.4 Thinkingが、Proプラン(月額200ドル)でGPT-5.4 Proが利用可能となっています。GPT-5.2は2026年6月5日に廃止が予定されているため、早めの移行計画を立てておくことをおすすめします。
GPT-5.4のライセンス
GPT-5.4はOpenAIのプロプライエタリ(独自開発・非公開)モデルであり、利用にあたってはOpenAIの利用規約(Terms of Service)が適用されます。
オープンソースモデルとは異なり、モデルの重みやソースコードが公開されているわけではないため、利用可能な範囲はOpenAIが提供するAPI・ChatGPTインターフェースを通じたアクセスに限定されます。
| 項目 | 可否 | 備考 |
|---|---|---|
| 商用利用 | ⭕️ | |
| 改変(モデル自体) | ❌️ | モデルの重みは非公開。ファインチューニングも現時点で非対応 |
| 再配布 | ❌️ | モデル自体の再配布は不可。API経由で生成した出力の利用は利用規約の範囲内で可能 |
| 特許利用 | 🔺 | OpenAIの知的財産に関する条項に準拠。APIを利用して構築したアプリケーションの特許取得は利用者側の判断 |
| 私的利用 | ⭕️ |
GPT-5.4の使い方
GPT-5.4の主な利用方法として、ChatGPTとAPIの2つの方法がありますので、それぞれの手順をご紹介していきます。
ChatGPTから利用する方法
1番お手軽にGPT-5.4を試すには、ChatGPTのWebインターフェースまたはアプリを使う方法があります。
ChatGPTにアクセスしてログイン
まず、ブラウザで https://chat.openai.com にアクセスするか、ChatGPTのモバイルアプリを開きます。アカウントをお持ちでない場合は新規登録を行ってください。
GPT-5.4 Thinkingを利用するには、Plusプラン(月額20ドル)以上への加入が必要です。画面左下の「Upgrade to Plus」から手続きを行います。GPT-5.4 Proを利用したい場合は、Proプラン(月額200ドル)が必要です。
モデルを選択する
チャット画面上部のモデルセレクターから「GPT-5.4 Thinking」を選択します。Proプランユーザーの場合は「GPT-5.4 Pro」も選択肢に表示されます。

プロンプトを入力して利用開始
モデルを選択したら、テキストボックスにプロンプトを入力して送信するだけです。画像を添付すればビジョン機能も活用できます。Plusプランでは週あたり最大3,000メッセージまで利用可能です。
API(Python)から利用する方法
開発者向けには、OpenAI APIを通じてGPT-5.4をプログラムから直接呼び出すことができます。
OpenAI Pythonライブラリをインストールする
ターミナルで以下のコマンドを実行して、最新のOpenAI Pythonライブラリをインストールします。
pip install --upgrade openaiAPIキーを環境変数に設定する
export OPENAI_API_KEY="sk-xxxxxxxxxxxxxxxxxxxxxxxx"GPT-5.4を呼び出すPythonコードを実行する
以下のコードで、GPT-5.4の標準版を呼び出すことができます。
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-5.4",
messages=[
{"role": "system", "content": "あなたは優秀なアシスタントです。"},
{"role": "user", "content": "Pythonでフィボナッチ数列を生成する関数を書いてください。"}
]
)
print(response.choices[0].message.content)もし、GPT-5.4 Proを使いたい場合は、model パラメータを "gpt-5.4-pro" に変更するだけです。
Computer Use機能をAPIで利用する方法
GPT-5.4の目玉機能であるComputer Useは、Responses APIから利用できます。
Responses APIでComputer Useツールを有効化する
Computer Use機能は、OpenAIのResponses APIにおいて computer_use ツールとして提供されています。下記のコードは、スクリーンショットベースでの操作指示を送る基本的な呼び出し例です。
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model="gpt-5.4",
tools=[{"type": "computer_use_preview"}],
input=[
{
"role": "user",
"content": "ブラウザを開いて、OpenAIの公式サイトにアクセスしてください。"
}
]
)
print(response.output)GPT-5.4はPlaywrightコードの生成やスクリーンショットに基づくマウス・キーボード操作の両方に対応しており、CodexのAgent環境と組み合わせることで、アプリケーション横断型のワークフロー自動化を実現できます。
【業界別】GPT-5.4の活用シーン
GPT-5.4の幅広い能力は、さまざまな業界での活用に適しています。こちらでは業界ごとに、特に効果が期待できるユースケースを紹介します。
金融・投資銀行業界
GPT-5.4は投資銀行アナリストレベルのスプレッドシートモデリングで87.3%のスコアを達成しており、財務モデルの構築や分析レポートの作成に高い適性があります。
ExcelやGoogle Sheetsへの直接統合によって、セルレベルでの計算式生成やデータ分析の自動化が可能です。決算資料の要約、リスク分析、ポートフォリオの評価レポート作成など、これまで何時間もかかっていた定型業務を大幅に効率化できるかと思います。
なお、金融業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

ソフトウェア開発業界
SWE-Bench Proで57.7%、Terminal-Bench 2.0で75.1%を記録したGPT-5.4は、コードベース全体を理解したうえでのバグ修正や機能追加に強みを発揮してくれます。
105万トークンのコンテキストウィンドウにより、大規模なコードベースを一度に読み込んでの分析も可能だと思います。また、Computer Use機能を活用すれば、IDEの操作やターミナルコマンドの実行まで含めた開発ワークフローの自動化も現実的になりそうです。
コンサルティング・ビジネスプロフェッショナル
知識労働ベンチマークで高いスコアを記録しているので、調査・分析・レポート作成といったコンサルティング業務との親和性の高さもありそうです。
プレゼンテーション資料の作成においても、人間の評価者の68%がGPT-5.4の出力を好んだという結果が出ており、クライアント向け資料の下書きや競合分析レポートの作成などに有効になると思います。
研究・学術機関
GPQA Diamond(94.4%、Pro版)という専門知識ベンチマークの高スコアから分かる通り、科学論文の要約や文献レビュー、実験計画の立案支援など、高度な専門知識を要するタスクにも対応できるかと思います。
長大なコンテキストウィンドウを活かして、複数の論文を一度に参照しながらのメタ分析や系統的レビューも可能になりそうです。
なお、教育業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

【課題別】GPT-5.4が解決できること
業界を問わず、多くの組織が共通して抱える課題に対して、GPT-5.4はどのようなソリューションを提供できるのかを整理します。
繰り返し発生する手作業のPC操作を自動化
GPT-5.4のComputer Use機能は、OSWorld-Verifiedで人間の性能(72.4%)を超える75.0%を達成しました。
スクリーンショットを見ながら、マウスクリックやキーボード入力を自律的に行ってくれるため、「毎日同じアプリケーションを開いて同じ手順でデータを入力する」といったルーティンワークの自動化に最適です。
RPAツールなんかと異なり、画面認識に基づいて柔軟に対応できる点が大きなメリットと言えると思います。
大量のドキュメントを効率的に処理
最大105万トークンのコンテキストウィンドウは、数百ページ相当のドキュメントを一度に処理できる能力を意味します。
契約書のレビュー、複数の報告書の横断分析、長文議事録の要約など、従来は分割して処理するしかなかった大量テキストの一括処理が可能になると思います。
スプレッドシートでの複雑な分析を効率化
Excel・Google Sheetsとの直接統合によって、スプレッドシート上で自然言語の指示を入力するだけで、複雑な関数の生成やデータ分析が可能です。
投資銀行レベルのモデリングタスクで87.3%のスコアを記録していることからも、財務分析やデータ集計の実務で即戦力になると考えられます。
GPT-5.4を使ってみた
ここからは、実際にGPT-5.4の注目機能を検証していきます。公式発表の性能が本当なのか、実際に確かめてみましょう。
検証1:Excel・Google Sheets統合で財務モデルを一発生成
GPT-5.4と同時にリリースされた目玉機能のひとつが、**ChatGPT for Excel / Google Sheets(ベータ版)**です。ChatGPTのチャット画面からスプレッドシートを直接操作できるこの機能を、実際に試してみました。
プロンプトはこちら
新しいGoogle Sheetsを作成し、飲食店の月次損益計算書を作って。1月〜6月の売上・原価・人件費・家賃・光熱費を入力し、各月の営業利益と利益率を自動計算する数式を入れて。売上は月300万円前後でランダムに変動させて。
すると、GPT-5.4はスプレッドシートをゼロから構築し、各項目に数式と書式を適用した状態で出力してくれました。スプレッドシートタスクで87.3%を記録したモデルだけあって、関数の使い方や表の構造はかなり実用的だと思います。

検証2:Codexアプリ経由でComputer Useを試用
続いて、Computer UseをCodexアプリ経由で実際に動かしてみます。
Codexアプリに搭載されているMCP(Model Context Protocol)連携を使ってPlaywrightサーバーを接続すると、GPT-5.4がブラウザのスクリーンショットを見ながらマウスやキーボードを操作し、Webアプリの動作確認まで自律的に行ってくれます。
プロンプトはこちら
ブラウザを開いて、Googleで『GPT-5.4 レビュー』と検索して。
検索結果の上位5件のページをそれぞれ開いて、各記事のタイトル・公開日・GPT-5.4に対する評価(ポジティブ/ネガティブ)を読み取って、比較表としてmarkdownファイルにまとめて。実行中の様子はこちら
出力結果はこちら

生成されたmdファイルはこちら

数分で問題なくタスクをこなしてくれました。途中ページ読み込みが遅いタイミングがあったんですが、自動的に数秒間待機してリトライしてくれました。
単純なスクリプト実行ではなく、画面の表示状態を見ながら柔軟に対応してくれる振る舞いは、まさに一部ベンチマークで人間超えを記録したモデルならではの挙動かなと思いました。
よくある質問
最後に、GPT-5.4に関するよくある質問とその回答をご紹介します。
まとめ
GPT-5.4は、OpenAIがプロフェッショナルな業務用途にも注力して開発したフロンティアモデルです。
人間を超えるComputer Use性能、105万トークンの超大容量コンテキスト、47%のトークン削減を実現するツールサーチ、そしてExcel/Google Sheetsとの直接統合と、実務ですぐに活用できる機能が豊富に揃っています。
気になった方は、ぜひ一度試してみてください!
最後に
いかがだったでしょうか?
弊社では、AI導入を検討中の企業向けに、業務効率化や新しい価値創出を支援する情報提供・導入支援を行っています。最新のAIを活用し、効率的な業務改善や高度な分析が可能です。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

