OpenAI史上最高の推論モデル「o3」使い方・性能比較・料金まで徹底解説

OpenAI 推論モデル o3 使い方 性能比較 料金
押さえておきたいポイント
  • OpenAI発の最新大規模言語モデル、従来モデルを圧倒する性能を誇る
  • ツールを自律的に組み合わせて問題解決
  • マルチモーダルなタスクも統合的に対応

OpenAI o3は2025年4月17日に公開された、「じっくり考えて答えを出す」推論モデルです。

こちらは同社の推論モデル「oシリーズ」の第2世代(o2は欠番)であり、2025年6月時点で最も高性能なLLMの一つになります。こちらは自力で答えを導き出す能力が強化されていて、画像・ツール使用の判断込みでマルチモーダルに推論できるのが特徴です。

​当記事では、そんなOpenAI o3の性能・料金・活用事例などを徹底解説!完読いただくと、従来モデル・競合モデルとの違いからo3ならではの使い道までが丸わかりです。

ぜひぜひ、最後までご覧ください。

目次

OpenAI o3の概要

o3は、OpenAIが2025年4月17日(米国時間16日)に公開した最新の大規模言語モデルです。

ユーザからの質問に対し、内部で段階的に推論を重ね、必要に応じてツールを使い分けながら数分以内に詳細な回答を生成します。

参考:https://openai.com/index/introducing-o3-and-o4-mini/

このようなエージェント的な振る舞いにより、複雑なマルチステップの課題にも従来以上に効果的に対処でき、ChatGPTの知的生産性を大きく向上させています。

また、o3は、コーディング、数学、科学、視覚的認識など幅広い分野で最先端の性能を示し、「Codeforces」や「SWE-Bench」、「MMMU」といったベンチマークで新たなSOTA(最高性能)を記録しています​。

参考:https://openai.com/index/introducing-o3-and-o4-mini/

特に、上記画像の「SWE-Bench」においては、これまで最高性能を誇っていたClaude 3.7 Sonnetの「62.3」を約7ポイントも上回る性能となっています。

o3は、多面的な分析が必要な複雑な問いに強く、画像・図表の解析など視覚情報を伴うタスクでも高い能力を発揮します。

外部専門家による評価もOpenAI公式HPにて報告されており、困難な現実世界タスクでo1(初代モデル)に比べ、重大な誤答を20%程度削減し、プログラミングやコンサルティング、創造的アイデア出しなどの領域で大きく性能向上しているとされています。

先行モデルGPT-4と比べても、長い推論を要する問題や、高度な専門知識を伴う質問でより高精度な回答を導き出す傾向があり、総合的な思考力が飛躍的に向上しています。

o3ファミリーのラインナップ

2025年6月時点で、OpenAI o3ファミリーは以下の3モデル構成となっています。

  • OpenAI o3:数学・コーディング・マルチモーダルタスクに優れた標準モデル
  • OpenAI o3-mini:o3に先駆けてリリースされていた軽量モデル(o4-mini登場時に廃止)
  • OpenAI o3-pro:AIME 2025(数学)とGPQA(理数の専門知識)でo3を超える上級モデル

うち、無印・OpenAI o3は「コストと性能のバランスがとれた標準モデル」という位置付けです。

OpenAI o3の訓練手法

ここではOpenAI o3で新採用された訓練手法と、それによるスペック面での進化をご紹介します。以下、メインの「推論」から詳細をみていきましょう!

AGI に近づく推論力(Reasoning Models)

OpenAI o3は、従来のGPT-3やGPT-4シリーズとは訓練手法が一部異なっています。

GPT-4では、膨大なテキスト予測による事前学習と人間によるフィードバックを経て「既存の正解を導き出す能力」を高めていました。

対してOpenAI o3では、大規模強化学習(RL)を通じて「自力で考える能力」を高めるアプローチが取られています。このアプローチによって、OpenAI o3は数学の難問や長いコードのバグ修正といった多段的な思考が求められる課題で、GPT-4シリーズ超えのパフォーマンスを実現。AGI(汎用人工知能)に一歩近づいた推論力を発揮します。※1

Thinking with Images:画像を交えたマルチモーダル思考

OpenAI o3では、同社のLLM初となる、テキストと画像を交えたマルチモーダルでの思考(Chain-of-Thought)をトレーニングに採用。このことにより、画像・図表・グラフィックの分析能力が向上しており、「ARC-AGI」や「MMMU」等マルチモーダルベンチマークでの高スコアが実現しています。※1、3

特に、AGIへの到達度を測る「ARC-AGI」については、OpenAI o3がLLM史上初めてクリアするという大快挙を達成!以下のような、「与えられた3例から左右の画像の法則性を求め、空白を埋める問題」も見事解決できるようになっています。

引用:https://arcprize.org/blog/oai-o3-pub-breakthrough

思考のマルチモーダル化により、問題解決の幅が広がったといえるでしょう。

Agentic Tool Use:ツール連携によるAIエージェント化

OpenAI o3では、AIエージェントとしての能力も向上しています。具体的には、トレーニングの段階でツールの適切な活用方法と活用タイミングを学習しており、複数のツールを連携させての柔軟な思考が可能です。ChatGPTにおいては、OpenAI o3を選択することで、Web検索・データ分析・画像生成…etc.が従来(プラグイン)よりもスムースに行えます。※1

強化された安全性と Jailbreak 耐性

OpenAI o3は安全面でも進化を遂げました。バイオリスク・マルウェア生成・Jailbreak(脱獄)…etc.危険なプロンプトの例を多く学習していて、従来よりも拒否できるプロンプトの種類が増えています。

また、OpenAI o3では危険なプロンプトを事前に検出する能力も向上。大企業での導入・運用にも耐えうるセキュリティ体制が実現しています。※1、2

o3ファミリー & 旧モデル・競合モデル比較

ここからは、OpenAI o3 / o3-miniの性能・API料金を旧モデルや競合モデルと比べていきます。まずは、旧モデル・OpenAI o1との比較からどうぞ!

o3 と o1 の比較

OpenAI o3は、先代・OpenAI o1比で圧倒的に高い性能を1/7以下の低コストで実現しています。詳細は下表のとおりで、o3 / o3-miniの両者で数学・コーディングを中心に性能向上が顕著です。※4、11

スクロールできます
比較項目内容OpenAI o3OpenAI o3-miniOpenAI o1
入力のAPI料金N/A$2.00/1Mトークン$1.10 / 1Mトークン$15.0/1Mトークン
キャッシュされた入力のAPI料金N/A$0.50/1Mトークン$0.55 / 1Mトークン$7.50/1Mトークン
出力のAPI料金N/A$8.00/1Mトークン$4.40 / 1Mトークン$60.00/1Mトークン
ChatGPT での使用上限N/A【Plus / Team / Enterprise】週100回【Pro】無制限【無料】1日10回【Plus】1日50回【Team / Pro】無制限【Plus / Team / Enterprise】週50回【Pro】無制限
AIME 20242024年度米国数学オリンピックの予選問題集91.6%87.3%74.3%
AIME 20252025年度米国数学オリンピックの予選問題集88.9%86.5%79.2%
Codeforces競技プログラミングの問題集(スコアはELO)270620731891
GPQA diamond専門家レベルの自然科学問題集83.3%77.0%78.0%
Humanity’s Last Exam人間的な知識・能力を問う問題集ツールなし:20.32%Python&検索ツールあり:24.90%13.40%8.12%(o1-pro)
MMMU大学レベルでテキスト&画像形式の問題集82.9%N/A77.6%
MathVistaマルチモーダルの数学問題集86.8%N/A71.8%
CharXiv-Reasoning理系の図表問題集78.6%N/A55.1%
SWE-Lancer: IC SWE Diamondフリーランスのコーディング事例に基づく問題集(スコアは報酬額)$65,250$17.375(o3-mini-high)$28,500(o1-high)
SWE-bench VerifiedGitHubのコーディング事例に基づく問題集69.1%49.3%48.9%
Aider polyglot各言語でのデバッグ問題集タスク全体:81.3%コード修正時:79.6%タスク全体:66.7%コード修正時:60.4%(o3-mini-high)タスク全体:64.4%コード修正時:61.7%(ともにo1-high)
Scale MultiChallenge指示を遵守する能力を測るテスト56.51%39.89%44.93%
TAU-benchAIエージェントとしての能力を測るタスク集小売サイト:73.9%航空券予約:52.0%小売サイト:57.6%航空券予約:32.4%(o3-mini-high)小売サイト:70.8%航空券予約:50.0%(ともにo1-high)

なお、先代・OpenAI o1について詳しく知りたい方は、下記の記事も併せてご確認ください。

o3 と o4-mini の比較

OpenAI o3とo4-miniはともに、同日にリリースされた推論モデルです。ただ両者の強みは下表のとおり違っていて、o3は「指示をより正確に実行できる」点が、o4-miniは「o3のほぼ半額で使える」点がそれぞれ魅力となっています。※4、11

スクロールできます
比較項目内容OpenAI o3OpenAI o3-miniOpenAI o4-mini
入力のAPI料金N/A$2.00/1Mトークン$1.10 / 1Mトークン$1.10/1Mトークン
キャッシュされた入力のAPI料金N/A$0.50/1Mトークン$0.55 / 1Mトークン$0.275/1Mトークン
出力のAPI料金N/A$8.00/1Mトークン$4.40 / 1Mトークン$4.40/1Mトークン
ChatGPTでの使用上限N/A【Plus / Team / Enterprise】週100回【Pro】無制限【無料】1日10回【Plus】1日50回【Team / Pro】無制限【Plus / Team / Enterprise】o4-mini-high:1日100回o4-mini:1日300回【Pro】無制限
AIME 20242024年度米国数学オリンピックの予選問題集91.6%87.3%93.4%
AIME 20252025年度米国数学オリンピックの予選問題集88.9%86.5%92.7%
Codeforces競技プログラミングの問題集(スコアはELO)270620732719
GPQA diamond専門家レベルの自然科学問題集83.3%77.0%81.4%
Humanity’s Last Exam人間的な知識・能力を問う問題集ツールなし:20.32%Python&検索ツールあり:24.90%13.40%ツールなし:14.28%Python&検索ツールあり:17.70%
MMMU大学レベルでテキスト&画像形式の問題集82.9%N/A81.6%
MathVistaマルチモーダルの数学問題集86.8%N/A84.3%
CharXiv-Reasoning理系の図表問題集78.6%N/A72.0%
SWE-Lancer: IC SWE Diamondフリーランスのコーディング事例に基づく問題集$65,250$17.375(o3-mini-high)$56,375
SWE-bench VerifiedGitHubのコーディング事例に基づく問題集69.1%49.3%68.1%
Aider polyglot各言語でのデバッグ問題集タスク全体:81.3%コード修正時:79.6%タスク全体:66.7%コード修正時:60.4%(o3-mini-high)タスク全体:68.9%コード修正時:58.2%
Scale MultiChallenge指示を遵守する能力を測るテスト56.51%39.89%42.99%
BrowseCompWebブラウジング能力を測るテスト49.7%N/A28.3%
TAU-benchAIエージェントとしての能力を測るタスク集小売サイト:73.9%航空券予約:52.0%小売サイト:57.6%航空券予約:32.4%(o3-mini-high)小売サイト:71.8%航空券予約:49.2%

なお、OpenAI o4-miniについて詳しく知りたい方は、下記の記事も併せてご確認ください。

ライバル「Claude 4 Sonnet / Gemini 2.5 Pro」との比較

OpenAI o3のライバルにあたる推論モデルとしては、Anthropicの「Claude 4 Sonnet」とGoogleの「Gemini 2.5 Pro」とが挙げられます。各モデルの料金・スペックは下表のとおりです。※5、6、7、8

スクロールできます
比較項目内容OpenAI o3Claude 4 SonnetGemini 2.5 Pro
入力のAPI料金N/A$2.00/1Mトークン$3.00/1Mトークン【プロンプトトークン200K以下】$1.25/1Mトークン【プロンプトトークン200K超】$2.50/1Mトークン
出力のAPI料金N/A$8.00/1Mトークン$15.00/1Mトークン【プロンプトトークン200K以下】$10.00/1Mトークン【プロンプトトークン200K超】$15.00/1Mトークン
GPQA diamond専門家レベルの自然科学問題集83.3%75.4%86.4%
AIME 20252025年度米国数学オリンピックの予選問題集88.9%70.5%88.0%
MMMU大学レベルでテキスト&画像形式の問題集82.9%74.4%82.0%
SWE-bench Verified(single attempt)GitHubのコーディング事例に基づく問題集69.1%72.7%59.6%
TAU-benchAIエージェントとしての能力を測るタスク集小売サイト:70.4%航空券予約:52.0%小売サイト:80.5%航空券予約:60.0%N/A

競合と比べて、OpenAI o3の強みは「全般的に問題解決能力が高い」点にあるといえます。一方で、AIエージェントとしての能力はClaude 4 Sonnetに、コストパフォーマンスはGemini 2.5 Proにそれぞれ一歩譲る形となっています。

なお、Claude 4の最強モデル「Opus」について詳しく知りたい方は、下記の記事も併せてご確認ください。

OpenAI o3のライセンス

o3は、OpenAIのクラウドAPIおよびChatGPTサービスを通じて提供されるモデルであり、オープンソースの形でモデル自体が公開されているわけではありません。

そのため、モデルの利用に関するライセンスは、主にサービス利用規約によって定められています。

利用用途可否備考
商用利用⭕️
改変❌️モデルの重み・コードは非公開のためユーザ側で変更不可
配布❌️モデルはOpenAIのサービス内でのみ利用可能
特許使用❌️
私的使用⭕️

o3のモデルそのものは公開されていないため、ユーザがモデルを直接入手して改良・再配布することはできません

一方で、OpenAIの利用規約により生成されたテキストなどのアウトプットはユーザに権利が帰属し、商用利用を含め自由に使用・共有できます​。

つまり、o3を使って得られた回答や成果物は制限なく活用できますが、モデル本体についてはOpenAIのプラットフォーム上でのみ利用可能となっています。

また、OpenAIは本モデルに関連する技術特許を保有していますが、通常のAPI利用においてユーザが特別な手続きを取る必要はありません。

詳細は、OpenAIコミュニティサイトやOpenAI公式HPを確認するようにしましょう。

o3 料金プラン

OpenAI o3を利用するには、大きく分けて「ChatGPT経由で使う方法」と、「OpenAI API経由で呼び出す方法」の2つがあります。

うち、ChatGPTでの利用は以下の有料プランでのみ可能です。※4、10

スクロールできます
プラン料金(税込)利用制限
Plus$20/月(¥2,700)週100回
Pro$200/月(¥30,000)​無制限
Team$30/ユーザ (月額、月払いの場合)※年契約なら$25/ユーザ/月週100回
Enterprise要問い合わせ (カスタム契約)週100回

また、OpenAI APIからは下表のとおり、トークン数に応じた従量課金制での利用も可能です。(料金は2025年6月10日時点)※9、11

スクロールできます
OpenAI o3OpenAI o3(Flex Processing)OpenAI o3-miniOpenAI o3-pro
入力のAPI料金$2.00 / 1Mトークン

$1.00 / 1Mトークン$1.10 / 1Mトークン$20.00 / 1Mトークン
キャッシュされた入力のAPI料金$0.50 / 1Mトークン$0.25 / 1Mトークン$0.55 / 1MトークンN/A
出力のAPI料金$8.00 / 1Mトークン$4.00 / 1Mトークン$4.40 / 1Mトークン$80.00 / 1Mトークン

このあたりは予算・目的に応じて、最適な料金プランやモデルを選ぶとよいでしょう。

OpenAI o3の使い方

o3を利用するまでの基本的な流れを、ChatGPTユーザ向けとAPI開発者向けに分けて解説します。

ChatGPT利用者向け

OpenAI/ChatGPTへの登録:未登録の方は、OpenAIのアカウントを作成し、ChatGPTにログイン。PlusやProの有料プランに加入することでo3モデルが選択可能です。

モデルの選択(ChatGPT UI):ChatGPTのインタフェースから、新規チャットを開きモデルを選択します。無料プランでは既定で高速応答のGPT-4o-miniが使われますが、メッセージ入力欄の左側にある〈Reason〉ボタンを選択することでo3-mini(推論モデル)を使用できます。Plusプランでは、モデル一覧からGPT-4やGPT-4.5に加えOpenAI o1やo3-miniを選択可能です。Proプランの場合は、利用制限なくこれらを選べます。モデルを選択したら通常どおりメッセージを入力し送信するだけで、o3の高度な推論能力を体験できます。

API開発者向け

APIキーの取得:自前のアプリケーションやコードからo3を使いたい方は、OpenAIのダッシュボードからAPIキーを取得します。その上で有料アカウント(Pay-as-you-go課金)を有効化し、必要に応じて上位モデル利用の申請または利用枠の拡大を行います​。

APIでモデルを呼び出す:OpenAIが提供する公式クライアントライブラリを使うか、HTTPリクエストを作成してChat Completions APIエンドポイントにアクセスします。リクエストJSON内で、modelパラメータに「openai-o3」を指定し、messagesフィールドにユーザのプロンプトを含めて送信します。o3はツール使用を伴う高度な推論を行うため、場合によっては追加のパラメータ指定が可能です。

応答の受信と処理:o3からの応答が返ってきたら、ChatGPT UI上ではテキストが表示されますが、API経由の場合はJSON形式で回答が得られるので、自分のアプリで必要に応じて表示形式を整えたり、他の関数に渡したりします。o3は回答中で外部情報を参照した場合、出典URLを【†】付きで明示してくれます​。回答内容の妥当性を検証しつつ、必要なら追加の質問を投げるなど対話を継続してください。

以上が基本的な利用フローです。「ChatGPTのモデル切替機能を使う」か「APIでモデル指定して呼び出す」ことでo3を利用することができます。特に、コード生成やデータ分析などエンジニア向け用途では、o3の推論能力とツール使用を組み合わせることで、人手では困難なタスクも自動化できる可能性があります。

次章では、具体的なタスク例と旧モデルとの比較検証をしていきます!

OpenAIの「o3」 VS 「o1 pro」性能比較してみた!

では実際に、o3の実力をいくつかのタスクで試し、旧世代モデル(ここではo1 pro modeを対象とします)との違いを比較してみましょう。

以下ではコーディング・英語・数学の代表的な3つのタスクについて、o1 proとo3の回答例を簡単に紹介します。

OpenAIの「o3」 VS 「o1 pro」性能比較してみた!

では実際に、o3の実力をいくつかのタスクで試し、旧世代モデル(ここではo1 pro modeを対象とします)との違いを比較してみましょう。

以下ではコーディング・英語・数学の代表的な3つのタスクについて、o1 proとo3の回答例を簡単に紹介します。

コーディングタスク

プロンプト(意図:複数の条件を組み合わせたソートが必要で、コードの正確性と網羅性が求められる。)
以下の整数リスト{test_numbers}について、素数は小さい順にソートし、それ以外の数は大きい順にソートして結合した新しいリストを返すPython関数を実装せよ。

test_numbers = [
    29, 45, 2, 14, 5,
    37, 21, 11, 44, 8,
    17, 9, 23, 31, 4,
    28, 13, 6, 19, 35
]
o1 pro 結果
import math

def is_prime(n: int) -> bool:
    """nが素数ならTrue、そうでなければFalseを返す"""
    if n < 2:
        return False
    for i in range(2, int(math.sqrt(n)) + 1):
        if n % i == 0:
            return False
    return True

def rearrange_numbers(numbers: list[int]) -> list[int]:
    """素数は小さい順、非素数は大きい順にソートして連結したリストを返す"""
    primes = []
    non_primes = []
    
    for num in numbers:
        if is_prime(num):
            primes.append(num)
        else:
            non_primes.append(num)
    
    # 素数は小さい順、非素数は大きい順に並べて連結
    return sorted(primes) + sorted(non_primes, reverse=True)

# 動作確認
test_numbers = [
    29, 45, 2, 14, 5,
    37, 21, 11, 44, 8,
    17, 9, 23, 31, 4,
    28, 13, 6, 19, 35
]

result = rearrange_numbers(test_numbers)
print(result)


# 関数実行結果
[2, 5, 11, 13, 17, 19, 23, 29, 31, 37, 45, 44, 35, 28, 21, 14, 9, 8, 6, 4]
o3 結果
実装のポイント
素数判定 is_prime

2 だけは特別に素数とみなし、以降は偶数を除外。

√n まで奇数で割り切れるかをチェックし、高速化しています。

リスト内包表記で分割

primes : 素数だけを抜き出して 昇順 sorted()

non_primes : それ以外を抜き出して 降順 sorted(reverse=True)

結合して返却

primes + non_primes で要件どおりの新しいリストが得られます。

def sort_primes_first(nums):
    import math
    def is_prime(n):
        if n < 2: return False
        if n == 2: return True
        if n % 2 == 0: return False
        for i in range(3, int(math.isqrt(n)) + 1, 2):
            if n % i == 0:
                return False
        return True

    primes      = sorted([x for x in nums if is_prime(x)])           # 昇順
    non_primes  = sorted([x for x in nums if not is_prime(x)], 
                          reverse=True)                              # 降順
    return primes + non_primes

実行例(上のセルで確認済み)
入力 test_numbers に対する出力:
[2, 5, 11, 13, 17, 19, 23, 29, 31, 37, 
 45, 44, 35, 28, 21, 14, 9, 8, 6, 4]

必要に応じて関数名やドキュメント文字列を変更してお使いください。

o1 proは、基本的なアルゴリズムで要件を満たし、結果も正確ですが、素数判定で偶数スキップやisqrt未使用など効率改善余地が大きく、コメントも最小限となっています。

対してo3は、偶数を先に除外しisqrtでループを半減、リスト内包で簡潔化するなど最適化が光っています。丁寧なドキュメントと計算量説明付きで学習コストを下げ、実装意図を言語化している点も高評価ですね!

英語タスク

プロンプト(意図:日本語特有の表現「煮え切らない態度」(=はっきりしない態度)を含み、直訳では不自然になるため文脈を踏まえた意訳が求められる。)
「彼は煮え切らない態度で返事をした。」を英語に翻訳して。
o1 pro 結果
「彼は煮え切らない態度で返事をした。」の自然な英語訳の例としては、以下のように言えます。

He gave a noncommittal response.

He responded in a noncommittal manner.

He answered vaguely, showing no clear commitment.
o3 結果
He gave a half‑hearted reply.

o1 proは、noncommittalを軸に三つの訳を並べ、意味を過不足なく表現していて問題なさそうですが、語感はややフォーマルで硬質な印象です。口語的な温度感が控えめな分、実運用ではトーンを調整する必要がありそうですね。

対してo3は、一文勝負で half‑hearted を採用しており、煮え切らなさを自然な口語に落とし込むセンスが光っていますね。語数はコンパクトながらもニュアンスは十分で、即実運用可能な文章になっていると思います。

数学タスク

プロンプト(意図:大規模言語モデルは桁数の多い計算や累積和を苦手とすることがあるため、その挙動を比較。)
$1+2+...+100$の和を求めよ
o1 pro 結果
o3 結果

o1 proは、公式提示→代入→「50 × 101」の途中計算→結論と段階を丁寧に追い、視覚的にも理解しやすいですが、等差数列 Sn の一般式や記号的背景に触れておらず、数学的汎用性の示唆がやや弱い印象です。

対してo3は、冒頭で Sn = n(n+1)/2 と一般形を明示し、S₁₀₀ を定義して一気に 5050 に導く構成が端的で洗練されている印象。汎用的な記号法を取り入れ、より数学的な厳密さを感じさせる反面、途中計算を省くため初学者への視覚的補助は少なめで、簡潔さと専門性を両立した説明スタイルだといえます。

活用シーンと具体的事例

ここからは、OpenAI o3の活用事例について、SNSで実際に確認できているものを3例ご紹介します。

今回解説する事例において、弊社がX(旧Twitter)で発見した参考となるツイートを紹介させていただいております。取り下げなどのご連絡は、contact@weel.co.jp からご連絡ください。

活用事例1.ひっかけ問題の検出・解決

OpenAI o3(o3-pro)は下記投稿のとおり、ひっかけ問題に強くなっています。

こちらの事例では、以下のひっかけ問題をプロンプトとして与えているのですが、OpenAI o3はこれを軽々とクリア。英語特有のあいまいな修飾表現(who is the boy’s father)や外科医が男性だという偏見に惑わされることなく、見事「外科医=少年の母親」であることを看破しています。

外科医であるその人は、少年の父親であり、「この少年には手術できない。彼は私の息子だから」と言います。さて、この外科医は少年にとって誰でしょう?

これなら、不親切な契約書や煩雑な法的文書もわかりやすく分解・要約できそうです。

活用事例2.ゲーム制作

OpenAI o3の手にかかると、「同じサイズの果物を合体させる某ゲームの3D版」も簡単に作れてしまいます。それがこちらです!

【和訳】

これは現実とは思えない
ChatGPT o3 はマジで本物の AGI だ。ゲームを作ってくれって頼んだら、次に何が起こったか信じられないと思う
この動画を見終わる頃には、君は完全に動作する 3D ゲームとローンチ計画を手にしてることになるよ――たとえ一度もコードを書いたことがなくても(マジで、これはブックマーク必須だよ)

すでに生成AIによるコーディングが普及しつつありますが、OpenAI o3のレベルになってくるとノンプログラマーでも高度なソフトウェアが作れる……かもしれません。

活用事例3.物理エンジンの制作

同じくOpenAI o3(o3-pro)を使ったコーディングの事例としては、以下のようなものもあります。

【和訳】

私はこっそりと、しばらくの間 o3-pro をテストしてきたんだ めちゃくちゃ安くて、速くて、しかも o1-pro より遥かに精度が高い(そして o3 と o3-pro のコーディング体験は、まるで別物)クールなテストもいくつか用意してるよ。まず最初は(もちろん)Hexagon Bouncing Ball のより難しいバージョンから
o3-pro は、ボールと壁の現実的な衝突をほぼ完璧に処理できた最初のモデルだ

この事例ではOpenAI o3を使い、以下のルールのもと、回転体と落下体の挙動を再現(=物理エンジン)しています。

  • 1辺の欠けた六角形×3が入れ子状に配置されて回転している
  • 1辺だけ赤い六角形も最外部に配置されていてこちらも回転している
  • ボールは中央から外側に向かって落下し、最外部の赤い辺に触れると中央に戻る

こちらは言葉にすると単純ですが、実際にはかなり複雑な動き。にもかかわらず、OpenAI o3はo1-proをはるかに上回るクオリティで、現実的なシミュレーションを生成してくれています。これぞRL(強化学習)の真髄ともいえる高性能ぶりですね。

まとめ

「o3」は、深い推論と自律的なツール連携によってGPT‑4を上回る実用力を発揮する最新モデルです。

生成物は商用利用が自由に行えますが、モデル自体の改変や再配布は許可されていません。料金は、ChatGPTの定額プランとAPI従量課金を組み合わせて柔軟に選択できます。UIでモデルを選ぶかAPI呼び出しで利用するだけで、コード生成・翻訳・数学などでo1 proをも大幅に凌駕する精度と効率を得られます

まだ触れてない方は、ぜひ一度その性能の高さを実感してみてください!

サービス紹介資料

生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

最後に

いかがだったでしょうか?

ChatGPTは単なるチャットツールではなく、議事録要約やFAQ自動化、コードレビュー、商品説明文の自動生成など、すでに多くの企業が実務で活用を始めています。

「自社の業務でも使えるのか?」「どのモデルが最適か?」といった検討に、実際のユースケースや導入事例をもとにご提案が可能です。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

まずは、無料相談にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

大規模言語モデル(LLM)比較レポート
LLM比較レポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

投稿者

  • WEEL Media部

    株式会社WEELが運営する生成系AI関連メディア「生成AI Media」は、AIの専門家によるWebメディアです。 AIに特化した編集部がAIの活用方法、導入事例、ニュース、トレンド情報を発信しています。

  • URLをコピーしました!
  • URLをコピーしました!
目次