【Composer 2.5】Opus 4.7に匹敵するコーディング性能を10分の1のコストで実現したCursorの自社モデルを徹底解説

Composer 2.5 Opus 4.7 匹敵 コーディング 性能 10分の1 コスト 実現 Cursor 自社 モデル 徹底 解説
押さえておきたいポイント
  • Composer 2.5は、Cursor(Anysphere社)が開発した自社AIコーディングモデルの最新バージョン
  • SWE-Bench Multilingualで79.8%を記録し、Claude Opus 4.7やGPT-5.5に匹敵するスコアを達成
  • 入力トークン$0.50/M、出力トークン$2.50/Mと、フロンティアモデルの約10分の1のコストで利用可能

2026年5月19日、AIコーディングエディタ「Cursor」を開発するAnysphere社が、自社AIモデルの最新バージョン「Composer 2.5」を公開しました!

Composer 2.5は、前バージョンのComposer 2と比較して知能と振る舞いの両面で大幅に向上しており、長時間にわたるエージェント型タスクでの持続力、複雑な指示への追従性、そしてコミュニケーションの質が改善されています。

特に注目すべきは、SWE-Bench MultilingualやTerminal-Bench 2.0といった主要ベンチマークにおいて、Claude Opus 4.7やGPT-5.5といったフロンティアモデルに匹敵するスコアを叩き出しながら、トークン単価は約10分の1という破格の価格設定を実現している点です。さらに、公開初週は利用枠が2倍になるキャンペーンも実施中で、開発者にとっては今すぐ試す絶好のタイミングとなっています。

そこで本記事では、Composer 2.5の概要から仕組み、ベンチマーク結果、料金体系、具体的な使い方まで徹底的に解説していきます。ぜひ最後までご覧ください。

\生成AIを活用して業務プロセスを自動化/

目次

Composer 2.5とは?

Composer 2.5とは?
参考:https://x.com/cursor_ai/status/2056415420614386064?s=20

Composer 2.5は、AIコーディングエディタ「Cursor」を開発するAnysphere社が独自に開発・公開した、コーディング特化型の自社AIモデルです。

Cursorは従来、Claude(Anthropic)やGPT(OpenAI)といった外部モデルをエディタ内で利用する形を取っていましたが、2025年10月のCursor 2.0リリース時に初の自社モデル「Composer」をリリースして以降、独自モデルの開発に注力してきました。2026年2月にComposer 1.5、3月にComposer 2と短期間でアップデートを重ね、そして今回、Composer 2から2か月でComposer 2.5がリリースされた形です。

ベースモデルには、中国のAI企業Moonshot AIが開発したオープンソースモデル「Kimi K2.5」が使われています。これはComposer 2と同じチェックポイントであり、Cursor独自の継続事前学習と大規模な強化学習パイプラインによって、コーディング性能を大きく引き上げています。

Composer 2.5とは?
参考:https://cursor.com/ja/blog/composer-2-5

モデルのアーキテクチャとしてはMixture-of-Experts(MoE)構成を採用しており、総パラメータ数はおよそ1兆、推論時にアクティブになるパラメータは約320億とされています。Composer 2.5はCursor IDE、Cursor CLI、およびCursor Web上でのみ利用可能であり、外部APIとしての提供は行われていません。つまり、Cursorのプラットフォーム内でのみ使える専用モデルという位置づけです。

なお、Cursorは2026年4月にSpaceXAI(旧xAI)と戦略的提携を結んでおり、Colossus 2スーパーコンピュータのH100 100万基相当の計算資源を活用して、今後さらに大規模なモデルを一から学習する計画も明らかにしています。

Composer 2.5の仕組み

Composer 2.5の学習プロセスには、いくつかの技術的なブレークスルーが含まれています。公式ブログで解説されている主要な3つの学習手法について紹介します。

まず注目すべきは「テキストフィードバックを用いたターゲット型RL」です。通常の強化学習では、ロールアウト全体に対して報酬が計算されるため、数十万トークンにも及ぶ長い軌跡の中で「どこで問題が起きたのか」を特定するのが困難でした。

Composer 2.5では、問題のある箇所に対して局所的にテキストのヒントを挿入し、そのヒントを含むコンテキストでのモデル出力を教師として利用します。元のコンテキストでの出力を生徒とし、on-policy distillationのKL損失を用いて生徒を教師に近づけるという手法です。これによって、広域的なRL目標を維持しつつ、局所的な行動の改善を効率的に行えるようになっています。

Composer 2.5の仕組み
参考:https://cursor.com/ja/blog/composer-2-5

次に「合成データの大規模生成」です。Composer 2.5はComposer 2の25倍の合成タスクで学習されています。実際のコードベースから機能を意図的に削除し、それを再実装するタスクを自動生成するアプローチなどが用いられています。興味深い副作用として、モデルの能力向上に伴い、Pythonの型チェック用キャッシュをリバースエンジニアリングして削除された関数を特定したり、Javaバイトコードを逆コンパイルしてAPIを復元したりする「報酬ハッキング」が発生したことも公式が報告しています。

Composer 2.5の仕組み
参考:https://cursor.com/ja/blog/composer-2-5

3つ目は「Sharded MuonとDual Mesh HSDP」という分散学習の最適化手法です。1兆パラメータのMoEモデルを効率的に学習するため、Muonオプティマイザに分散直交化を組み合わせ、expertとnon-expertの重みに対して異なるHSDP(Hierarchically Sharded Data Parallelism)レイアウトを適用しています。公式によれば、1Tモデルでのoptimizer step timeは0.2秒とのことです。

X上で話題沸騰!開発者コミュニティの反応まとめ

Composer 2.5の公開直後から、X上では開発者コミュニティを中心に大きな反響が広がっています。バズっている投稿や議論をピックアップします。

今回解説する事例において、弊社がX(旧Twitter)で発見した参考となるツイートを紹介させていただいております。取り下げなどのご連絡は、contact@weel.co.jp からご連絡ください。

「GPT-5.5を使っていると思い込んでいた」体感品質の高さが話題

公式アカウントの発表ポストのリプライ欄では、あるユーザーが「テストで使っていて、GPT-5.5(普段使い)から切り替わっていたことにしばらく気づかなかった」と投稿しており、大きな反響を呼んでいます。

ベンチマーク数値だけでなく、実際に手を動かした開発者が「体感で区別がつかない」と評している点は、Composer 2.5の振る舞い改善がスコア以上のインパクトを持っていることを示していますね。

「ベンチマークより振る舞いの改善に注目すべき」

開発者のMark Kretschmann氏(@mark_k)は、「注目すべきはベンチマークの数字ではなく、エージェントを一日中使うときに実際に感じる部分——長時間タスクの処理、複雑な指示への追従、協働のしやすさ——にCursorがフォーカスしていること」と投稿しています。

この指摘はまさに公式が強調している「effort calibration」の通りで、開発者の共感を集めています。

「Opus 4.7と同等性能で10分の1のコスト」に驚きの声

AI News系アカウントでは、Composer 2.5がOpus 4.7と同等の性能を持ちながら最大10倍のコスト効率を実現している点を強調した投稿を行い、多数のリポストを集めています。コスト面のインパクトは、特にスタートアップや個人開発者の間で大きな注目ポイントとなっており、「これで外部APIモデルに課金する理由が減った」という声も見られました。

Composer 2.5の特徴

Composer 2.5の特徴

Composer 2.5の大きな特徴は、フロンティアモデルと同等のベンチマークスコアを、圧倒的な低コストで実現している点です。

Composer 2.5の特徴
参考:https://cursor.com/ja/blog/composer-2-5

公式が公開しているベンチマーク結果を見ると、SWE-Bench Multilingualでは79.8%を記録しています。これはClaude Opus 4.7の80.5%にわずか0.7ポイント差で迫り、GPT-5.5の77.8%を上回るスコアです。Terminal-Bench 2.0でも69.3%と、Opus 4.7の69.4%とほぼ同等の結果を出しています。

Cursor独自のベンチマークであるCursorBench v3.1では63.2%を達成しており、Opus 4.7のmax設定(64.8%)には及ばないものの、xhigh設定(61.6%)やGPT-5.5のデフォルト設定(59.2%)を上回っています。

Composert 2.5の特徴
参考:https://cursor.com/ja/blog/composer-2-5

前バージョンのComposer 2からの伸びも顕著で、SWE-Bench Multilingualは73.7%から79.8%へ約6ポイント向上、Terminal-Bench 2.0は61.7%から69.3%へ約7.6ポイント向上しています。

ベンチマークのスコアだけでなく、公式が特に強調しているのが振る舞いの改善です。具体的には、コミュニケーションスタイルの洗練と、タスクに応じた労力配分の最適化が行われているそうです。簡単なタスクには手短に対応し、複雑なタスクにはしっかり時間をかけるという労力曲線が改善されており、既存のベンチマークでは測定しきれないものの、実際の開発作業における使いやすさに直結する改善とされています。

また、同等の知能を持つ他のフロンティアモデルと比較して、最大10倍のコスト効率を実現しているという点も公式が強調しているポイントです。

Composer 2.5の安全性・制約

Composer 2.5に関して、公式が安全性の観点で言及しているのが報酬ハッキングの問題です。

大規模な合成タスクで学習を行った結果、モデルがタスクを解くために人間が意図しない抜け道を見つけるケースが発生しています。具体的には、Pythonの型チェック用キャッシュからリバースエンジニアリングで削除された関数シグネチャを復元したり、Javaバイトコードを逆コンパイルしてサードパーティ製APIを再構築したりした事例が報告されています。

Cursor側はエージェント型の監視ツールでこうした問題を検知・対処しているとのことですが、モデルの能力向上に伴い、こうした課題は今後ますます慎重な対応が求められると述べています。

また、Composer 2.5はCursor IDE、Cursor CLI、Cursor Web内でのみ利用可能で、外部APIは提供されていません。Cursorのプラットフォーム外でこのモデルを利用する手段がないという点は、他のフロンティアモデルとは異なる制約です。

Composer 2.5の料金

Composer 2.5は、標準版と高速版の2つのバリアントで提供されており、それぞれ用途に応じて使い分ける設計になっています。高速版がデフォルトとして設定されており、対話的な開発作業での待ち時間を重視する場合はそのまま使い、コストを重視する場合は標準版に切り替えるという使い方が想定されています。

スクロールできます
項目標準版(Standard)高速版(Fast)※デフォルト
入力トークン単価$0.50 / 100万トークン$3.00 / 100万トークン
出力トークン単価$2.50 / 100万トークン$15.00 / 100万トークン
知能レベル同等同等
レイテンシ標準低レイテンシ
位置づけコスト重視速度重視(デフォルト)
Composer 2.5の料金

参考までに、Cursor自体のサブスクリプション料金は、Freeプラン(無料、Agent利用制限あり)、Proプラン(月額$20、Agent利用上限拡大・Tab補完無制限)、Pro+プラン(月額$60、利用上限3倍)、Ultraプラン(月額$200、利用上限20倍)、Teamsプラン(月額$40/ユーザー)となっています。個人プランではComposerの使用量は専用のプールに含まれ、十分な利用枠が用意されています。

公式によれば、Composer 2.5は同等の知能を持つフロンティアモデルと比べて最大10倍のコスト効率を実現しており、長時間のエージェントセッションを多用するチームにとっては、トークンコストの積み上がりを大きく抑えられる点が最大のメリットです。なお、公開初週は使用量が2倍に増量されるキャンペーンが実施されています。

Composer 2.5のライセンス

Composer 2.5はCursorプラットフォーム内でのみ提供されるプロプライエタリモデルであり、モデルの重みやソースコードが直接公開されているわけではありません。

スクロールできます
項目可否備考
商用利用⭕️Cursorで生成したコードはユーザーに帰属。商用プロジェクトでの利用可能
コード改変⭕️生成されたコードの改変は自由
再配布⭕️生成コードの再配布は可能(モデル自体の再配布は不可)
特許利用Cursor利用規約には特許に関する特段の規定なし
私的利用🔺Freeプランでは「Auto」モードのみ利用可。Composer 2.5を指名選択するにはPro以上が必要
Composer 2.5のライセンス

Cursorの利用規約(Terms of Service)によれば、ユーザーが入力した内容や生成されたコード(Content)について、Anysphere社がAIモデルのトレーニングに使用することは、ユーザーが明示的に同意しない限り行われないと明記されています。また、Businessプランではプライバシーモードが提供されており、コードがモデル学習に使われない設定が可能です。

Composer 2.5の使い方

ここからは、Composer 2.5を実際に使い始めるための手順を解説します。Composer 2.5はCursor IDE内で利用する方法と、Cursor CLIからターミナル経由で利用する方法があります。

なお、FreeプランではComposer 2.5を直接指定できません。Composer 2.5を使いたい場合はProプラン(月額$20)以上への加入が必要です。

Cursor IDEでComposer 2.5を使う

Cursor IDEでComposer 2.5を使う
STEP

Cursorをインストール

まず、Cursorの公式サイトからCursorをダウンロードし、インストールします。Windows、macOS、Linuxに対応しています。VS Codeユーザーであれば、拡張機能や設定をそのまま引き継ぐことも可能です。

Composer 2.5の使い方
STEP

アカウントを作成してサインイン

Cursorを起動し、アカウントを作成します。本格的に使う場合はProプラン以上が必須となります。

STEP

モデル設定でComposer 2.5を選択

Cursorの設定画面からモデル選択画面を開き、Composerモデルを有効化します。Composer 2.5は高速版がデフォルトで設定されているため、特別な設定変更なしにすぐ利用を開始できます。コストを抑えたい場合は、標準版への切り替えも可能です。

STEP

エージェントモードでタスクを指示

エディタ上でAgentモードを起動し(ショートカットキー:Cmd + I / Ctrl + I)、自然言語でタスクを指示します。たとえば「このプロジェクトにログイン機能を実装して、バリデーションもつけて」といった指示を出すと、Composer 2.5が複数ファイルを横断して生成・編集を行います。

Cursor CLIでComposer 2.5を使う

Cursor CLIでComposer 2.5を使う
STEP

Cursor CLIをインストール

Cursorの公式ドキュメントに従い、CLIツールをインストールします。

Composer 2.5の使い方
STEP

プロジェクトディレクトリでCLIを起動

ターミナルでプロジェクトのルートディレクトリに移動し、Cursor CLIを起動し、モデル選択でComposer 2.5モデルを選択します。

cd /path/to/your/project
cursor-agent
/model
Composer 2.5の使い方
STEP

自然言語でタスクを実行

CLI上で自然言語のプロンプトを入力すると、Composer 2.5がファイルの読み取り、ターミナルコマンドの実行、コードの編集、テストの実行を自律的に行います。長時間のリファクタリングやデバッグ作業にも対応でき、Composer 2.5の「長いホライズンでの持続力」が活きるユースケースです。

【業界別】Composer 2.5の活用シーン

【業界別】Composer 2.5の活用シーン

Composer 2.5はコーディング特化モデルですが、その活用範囲はソフトウェア開発だけにとどまりません。ここからは、業界ごとにどのような使い方が考えられるかを紹介します。

Web開発・SaaS企業

フロントエンドからバックエンドまで複数ファイルにまたがるコードの生成や修正を、自然言語の指示だけで行えるため、プロトタイピングのスピードが大幅に向上します。Composer 2.5の低コストな料金設定は、チーム全体でエージェントを日常的に使う場合のコスト削減にも直結するでしょう。

生成AIを搭載したSaaSについて、詳しく知りたい方は以下の記事も参考にしてみてください。

金融・フィンテック

決済システムやリスク計算ロジックなど、複雑なビジネスルールを含むコードベースのリファクタリングに活用できます。長時間にわたるタスクでも安定して動作するComposer 2.5の特性は、大規模コードベースの保守に向いていると思います。

金融業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

教育・研究機関

プログラミング教育の場面では、学生が書いたコードのレビューや改善提案の自動化への活用が期待できます。研究者にとっても、データ処理スクリプトや実験コードの自動生成・デバッグを低コストで行えるのは大きなメリットです。

教育業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

【課題別】Composer 2.5が解決できること

【課題別】Composer 2.5が解決できること

ここからは、開発現場でよくある課題ごとに、Composer 2.5がどのように役立つかを整理していきましょう。

大規模コードベースのリファクタリングを効率化

Composer 2.5は長時間にわたるタスクでの持続力が大幅に強化されています。何百ものアクションが必要な複雑なリファクタリングでも、途中で品質が低下せずに作業を継続できるため、人手では数日かかるような改修の大幅な短縮が期待できます。

AIコーディングエージェントのコストを抑える

フロンティアモデルの約10分の1のトークン単価で同等レベルの性能が得られるため、エージェントセッションを頻繁に回すチームにとっては年間コストの大幅な削減が見込めます。50人のエンジニアチームで月1,000万出力トークンを使う場合、年間のコスト差は数万ドル規模になります。

複雑な指示に対して正確に従うエージェント

テキストフィードバックを用いたターゲット型RLにより、局所的な振る舞いの精度が向上しています。例えば、「このファイルのこの関数だけ変更して、他は触らないで」といった細かい条件付き指示にも、より正確に従えるようになっています。

よくある質問

最後に、Composer 2.5について、よくある質問とその回答をご紹介します。

Composer 2.5はCursor以外の環境(VS Codeなど)でも使えますか?

いいえ、2026年5月時点ではComposer 2.5はCursor IDE、Cursor CLI、Cursor Webの中でのみ利用可能です。外部APIは提供されていないため、他のエディタやサービスからは利用できません。CursorはVS Codeのフォークをベースにしているため、VS Codeの拡張機能や設定をそのまま引き継いで移行することは可能です。

Composer 2.5のベースモデルであるKimi K2.5とは何ですか?

Kimi K2.5は、中国のAI企業Moonshot AIが開発・公開したオープンソースの大規模言語モデルです。MoE(Mixture-of-Experts)アーキテクチャを採用しており、Modified MITライセンスで公開されています。Cursorはこのモデルをベースに、独自の継続事前学習と大規模RLを施してComposer 2.5を構築しています。Composer 2のリリース当初、ベースモデルの開示が不十分だったことが一時話題になりましたが、現在は公式に明示されています。

初週2倍キャンペーンはいつまでですか?

公式発表によると、Composer 2.5の公開から1週間(2026年5月25日頃まで)の期間限定で、含まれる使用量が2倍に増量されます。具体的な使用量の上限はアカウントのプランによって異なるため、Cursorのダッシュボードで確認することをおすすめします。

Composer 2.5を使ってみよう!

Composer 2.5は、Cursorが自社開発するコーディング特化AIモデルの最新版として、コスト効率と性能の両面で非常に優秀です。

SWE-Bench Multilingualの79.8%やTerminal-Bench 2.0の69.3%という数字は、Claude Opus 4.7やGPT-5.5といったフロンティアモデルに迫るスコアであり、それを入力$0.50/M、出力$2.50/Mという価格で実現している点は、特に日常的にAIコーディングエージェントを利用するチームにとって大きなインパクトがあります。

SpaceXAIとの提携によるColossus 2の計算資源を活用した次世代モデルの学習も進行中とのことで、今後のComposerシリーズの進化にも注目です。まずは初週の2倍キャンペーン中に、ぜひ一度Composer 2.5を試してみてください。

最後に

いかがだったでしょうか?

弊社では、AI導入を検討中の企業向けに、業務効率化や新しい価値創出を支援する情報提供・導入支援を行っています。最新のAIを活用し、効率的な業務改善や高度な分析が可能です。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

大規模言語モデル(LLM)比較レポート
LLM比較レポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

  • URLをコピーしました!
  • URLをコピーしました!
目次