【MiniMax M3】GPT-5.5超えのオープンウェイトモデルの性能・料金・使い方を徹底解説

MiniMax M3 GPT-5.5 超え オープンウェイトモデル 性能 料金 使い方 徹底 解説
押さえておきたいポイント
  • MiniMax M3はコーディング・100万トークンコンテキスト・マルチモーダルの3機能を統合した初のオープンウェイトモデル
  • SWE-Bench Proで59.0%を記録し、GPT-5.5やGemini 3.1 Proを上回る性能
  • API料金は入力$0.30 / 出力$1.20(プロモ価格)でClaude Opusの約5%のコスト

2026年6月1日、中国・上海のAI企業MiniMaxは公開した次世代フラッグシップAIモデル「MiniMax M3」をリリースしました!

コーディング性能を測るSWE-Bench Proでは59.0%のスコアを記録し、GPT-5.5やGemini 3.1 Proを上回る結果を叩き出しています。

とはいえ、「具体的にどう使うの?」「オープンウェイトって何が嬉しいの?」「料金はどのくらい?」と気になっている方も多いのではないでしょうか。

そこで本記事では、MiniMax M3の概要・仕組み・料金体系から具体的な使い方、活用シーンまでを網羅的に解説します。ぜひ最後までご覧ください!

\生成AIを活用して業務プロセスを自動化/

目次

MiniMax M3とは?

MiniMax M3とは?
参考:https://www.minimaxi.com/

MiniMax M3は、上海拠点のAIスタートアップMiniMaxが開発したトリリオンパラメータ級のMoE(Mixture of Experts)型マルチモーダル基盤モデルです。2026年1月に香港証券取引所に上場した同社が、M2シリーズの集大成としてリリースした次世代モデルとなっています。

最大の注目ポイントは、「フロンティアレベルのコーディング能力」「100万トークンの超長文コンテキスト」「ネイティブマルチモーダル対応」という3つの最先端機能を、オープンウェイトモデルとして初めて1つに統合した点です。MiniMax公式は、この3つの機能をすべて備えたオープンウェイトモデルは2026年6月時点でM3のみだと明言しています。

テキスト・画像・動画の入力をネイティブにサポートしており、デスクトップPCの操作にも対応するなど、単なる言語モデルの枠を超えた汎用的なエージェントプラットフォームとしての性格を持っています。

M2シリーズでは一度廃止されたスパースアテンションを、MSAという新設計で復活させたのもM3の大きな転換点です。この技術的なU ターンによって、100万トークンという超長文コンテキストを実用的なコストと速度で扱えるようになったのが、単なるスペックアップとは異なるM3の本質的な進化と言えそうです。

MiniMax M3の仕組み

MiniMax M3のアーキテクチャを理解するうえで最も重要なのが、MSA(MiniMax Sparse Attention)と呼ばれる独自のスパースアテンション機構です。

MiniMax M3の仕組み
参考:https://www.minimax.io/blog/minimax-m3

従来のTransformerが採用するフルアテンションは、すべてのトークンが他のすべてのトークンに注意を払う仕組みのため、コンテキスト長が2倍になるとアテンション計算量はおよそ4倍に膨れ上がります。これが、長文コンテキストの推論コストを爆発的に増大させるボトルネックでした。

MSAはこの問題に対して、KVキャッシュをブロック単位で分割し、各クエリに対して最も関連性の高いブロックだけを選択的に参照するというアプローチで解決しています。公式の説明によると、MSAは、KVを外側のループとして、ヒットしたクエリを集約する方式を採用しており、各ブロックは1回だけ読み込まれるため、メモリアクセスが連続的になり演算効率が大幅に向上します。

この設計によって実現された性能改善は、公式発表によると以下のとおりです。

スクロールできます
項目性能改善
プリフィル速度前世代比で約9.7倍高速化
デコード速度前世代比で約15.6倍高速化
1トークンあたりの計算量100万トークン時に前世代の約1/20
MSAにより改善された性能

MSAの技術的なポイントは、DeepSeekのMulti-head Latent Attention(MLA)とは異なり、圧縮されていない生のKV値を扱う点にあります。これにより、長文コンテキスト推論時の精度低下を回避しつつ、計算コストを劇的に削減できるという設計思想が反映されています。

MiniMax M3の特徴

MiniMax M3の大きな特徴は、コーディング・エージェント・長文処理・マルチモーダルという4つの領域で同時に最先端クラスの性能を発揮する点です。

コーディング・エージェントベンチマーク

M3は複数の国際的なベンチマークで、フロンティアモデルに匹敵するスコアを記録しています。MiniMaxの公式発表によるベンチマーク結果は以下のとおりです。

MiniMax M3の特徴
参考:https://www.minimax.io/blog/minimax-m3
スクロールできます
ベンチマークMiniMax M3GPT-5.5Gemini 3.1 ProClaude Opus 4.7
SWE-Bench Pro59.0%58.6%54.2%64.3%
Terminal-Bench 2.166.0%78.2%70.0%
SWE-fficiency34.8%
KernelBench Hard28.8%
MCP Atlas74.2%77.0%
BrowseComp83.579.3
SVG-Bench63.7%62.3%
MiniMax M3と競合モデルのベンチマーク比較表

SWE-Bench ProではGPT-5.5(58.6%)とGemini 3.1 Pro(54.2%)を上回り、Claude Opus 4.7(64.3%)に迫る水準に到達しています。また、自律的なWeb閲覧・情報取得能力を測定するBrowseCompでは83.5というスコアでOpus 4.7(79.3)を超えたと報告されています。

長時間自律稼働の実証

MiniMax M3の特徴
参考:https://www.minimax.io/models/text/m3

ベンチマークのスコアだけでなく、MiniMax M3は長時間にわたる自律的なタスク実行能力でも注目を集めています。公式の実験事例では、ICLR 2025の最優秀論文を与えて再現実験を指示したところ、M3は約12時間にわたり自律的に稼働し、18件のコミットと23枚の実験グラフを独力で生成しました。

さらに印象的なのが、NVIDIA Hopper GPUでのFP8行列演算カーネルの最適化タスクです。M3は参照実装なしの状態から約24時間連続で稼働し、147回のベンチマーク提出と1,959回のツール呼び出しを経て、ハードウェア利用率を7.6%から71.3%まで引き上げました。

これらの実験結果は、M3が単なるコード生成ツールではなく、長期的な計画立案と自律的な試行錯誤が可能なエージェントとしての実力を備えていることを示しています。

ネイティブマルチモーダル

MiniMax M3は、マルチモーダル能力も学習の初期段階から深く統合しています。OmniDocBenchではGemini 3.1 Proを上回り、自律エージェント評価フレームワークClaw-Evalでは最高スコアを獲得しています。

画像・動画の理解に加えて、デスクトップPCの画面操作にも対応するという、エンドツーエンドの自律エージェントとして幅広い活用が期待できるモデルです。

MiniMax M3の安全性・制約

MiniMax M3は高性能なモデルですが、いくつかの留意点があります。

まず、公式に発表されているベンチマークスコアは、MiniMax自身のインフラ上で、Claude CodeやMini-SWE-Agentといったエージェントスキャフォールディングを使用して計測されたものが含まれています。独立した第三者による検証結果は今後のコミュニティの評価を待つ必要があります。

また、前世代モデルのM2.7では日本語出力時に中国語や韓国語が混入するケースがX上で報告されており、M3でも日本語の出力品質については実際に検証する必要があるでしょう。

100万トークンの超長文コンテキストについても、51.2万トークン超のリクエストは2026年6月時点では数量限定でのアクセスとなっており、一般公開は今後数日以内を予定している段階です。

MiniMax M3の料金

MiniMax M3のAPI料金体系は、入力トークン数と利用ティアによって段階的に設定されているのが特徴です。2026年6月1日のリリース時点では、7日間限定で50%オフのプロモーション割引が適用されています。

MiniMax M3の料金
参考:https://www.minimax.io/blog/minimax-m3
スクロールできます
プラン入力出力プロンプトキャッシュ読取
≤ 51.2万トークン(プロモ価格)$0.60 $0.30 / 100万トークン$2.40 $1.20 / 100万トークン$0.12 $0.06 / 100万トークン
> 51.2万トークン$1.20 / 100万トークン$4.80 / 100万トークン$0.24 / 100万トークン
MiniMax M3 Standardティアの料金表
スクロールできます
プラン入力出力プロンプトキャッシュ読取
≤ 51.2万トークン(プロモ価格)$0.90 $0.45 / 100万トークン$3.60 $1.80 / 100万トークン$0.18 $0.09 / 100万トークン
> 51.2万トークン$1.80 / 100万トークン$7.20 / 100万トークン$0.36 / 100万トークン
MiniMax M3 Priorityティアの料金表

Priorityティアはservice_tierパラメータで有効化でき、高負荷環境でのリクエスト優先スケジューリングが受けられるプランです。

この料金設定をClaude Opus 4.7(入力$5.00 / 出力$25.00)やGPT-5.5(入力約$10.00 / 出力約$30.00)と比較すると、M3はプロモ価格で入力コストが約16〜33分の1という圧倒的なコスト優位性があります。

MiniMax M3のライセンス

MiniMax M3はオープンウェイトモデルとして公開されていますが、ライセンスの扱いには注意が必要です。

前世代のM2.7では、モデルウェイトのダウンロードと研究目的での利用は自由に行える一方、商用利用にはMiniMaxの事前の書面による許可が必要というライセンス条件が設定されていました。M3についても同様のライセンス体系が踏襲される見込みです。

スクロールできます
利用形態可否
私的利用(研究・個人開発)⭕️
商用利用🔺(MiniMaxの書面許可が必要)
改変(ファインチューニング含む)⭕️
再配布🔺(ライセンス条項の確認が必要)
特許利用🔺(個別確認推奨)
MiniMax M3のライセンス

ここで重要なのは、「オープンウェイト」と「オープンソース」は同義ではないという点です。M3はモデルの重みファイルをダウンロードして自前のインフラで動かすことはできますが、トレーニングデータやトレーニングコードまでは公開されていません。商用のAPIホスティングサービスとしてM3を利用したい場合は、MiniMaxへの事前申請が必須になります。

MiniMax M3の使い方

MiniMax M3にアクセスする方法は複数用意されています。ここからは、代表的な3つの方法をステップ・バイ・ステップで解説します。

MiniMax Agent(Mavis)で試す

MiniMax Agentは、M3をブラウザ上で手軽に試せるチャット型インターフェースです。2026年6月のアップデートで「Mavis」という名称に一新されました。

STEP
MiniMax Agentにアクセス

ブラウザで MiniMax Agentページ にアクセスします。

MiniMax M3の使い方

アカウントを作成するか、Googleアカウントなどでログインします。

STEP
プロンプト送信

チャット画面が表示されたら、そのままプロンプトを入力するだけでMiniMax M3を体験できます。M3がデフォルトモデルとして設定されており、コーディングタスクやマルチモーダル入力もここから試すことができます。

MiniMax M3の使い方

MiniMax Platform APIを使う

自分のアプリケーションやエージェントにMiniMax M3を組み込みたい場合は、APIを利用します。OpenAI互換のエンドポイントを採用しているため、既存のコードからの移行もスムーズです。

STEP
MiniMax APIプラットフォームにアクセス

MiniMax APIプラットフォーム にアクセスし、アカウントを作成します。

STEP
APIキー発行

APIキーを発行します。ダッシュボードの「API Keys」セクションからキーを生成できます。

STEP
残高チャージ

残高をチャージします。Pay as You Go方式のため、事前にクレジットを購入する必要があります。

STEP
API呼び出し

以下のようなcurlコマンドでAPIを呼び出せます。

curl https://api.minimax.io/v1/chat/completions \
  -H "Authorization: Bearer $MINIMAX_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "MiniMax-M3",
    "messages": [
      {"role": "user", "content": "このリポジトリの構造を要約して、リファクタリング計画を提案してください。"}
    ]
  }'

モデルIDはMiniMax-M3を指定します。ストリーミング出力や画像入力にも対応しており、「thinking」モードと「non-thinking」モードの切り替えにも対応しています。

Ollama Cloud + Claude Code / OpenCodeで使う

OllamaとMiniMaxの公式パートナーシップにより、Ollama Cloud経由でMiniMax M3をClaude CodeやOpenCodeなどのコーディングエージェントで利用できます。ゼロデータリテンション(データ保持なし) のUS拠点環境で動作するのが特徴です。

STEP
Ollamaインストール

Ollamaがインストールされていない場合は、Ollama公式サイトからインストールしましょう。

STEP
各種エージェントからMiniMax M3を起動

以下のコマンドでMiniMax M3を各種エージェントで起動できます。

# Claude Codeで使う場合
ollama launch claude --model minimax-m3:cloud

# OpenCodeで使う場合
ollama launch opencode --model minimax-m3:cloud

# Codexで使う場合
ollama launch codex --model minimax-m3:cloud

コマンドを実行するとエージェントが起動し、MiniMax M3をバックエンドとしてコーディングタスクを開始できます。

MiniMax M3の使い方

【業界別】MiniMax M3の活用シーン

MiniMax M3はコーディング・エージェント・長文処理・マルチモーダルという4つの強みを持つため、さまざまな業界で活用の可能性が広がっています。ここからは、特に相性の良い業界別のユースケースを紹介します。

ソフトウェア開発・SIer業界

MiniMax M3の最も得意とする領域がソフトウェア開発です。100万トークンのコンテキストウィンドウにより、大規模リポジトリ全体を一度に読み込んだうえでバグ修正やリファクタリングの提案を行うことができます。

SWE-Bench Proでの高スコアが示すとおり、実際のソフトウェアエンジニアリングの問題を解決する能力に長けており、コードレビューの自動化やCIパイプラインへの組み込みなど、開発チームの生産性向上に直結する使い方が想定されます。

生成AIを搭載したSaaSについて、詳しく知りたい方は以下の記事も参考にしてみてください。

金融・コンサルティング業界

大量の決算資料や契約書、規制文書を一度に投入して横断的に分析できるのがMiniMax M3の強みです。

100万トークンという入力サイズは、数千ページ分のドキュメントに相当します。金融監査レポートの自動チェックや、複数企業のIR資料をまとめて比較分析するといったワークフローにおいて、M3のコストパフォーマンスはClaudeやGPT-5.5と比べても有利に働くでしょう。

金融業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

学術・研究機関

MiniMaxの公式デモでも紹介されているように、MiniMax M3は学術論文の自律的な再現実験という高度なタスクをこなすことができます。論文のPDFと関連コードを長文コンテキストに入れ、実験の設計から実行・結果の可視化までを自律的に行うワークフローは、研究者の実験サイクルを劇的に加速させる可能性を秘めています。

教育業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

【課題別】MiniMax M3が解決できること

ここからは、実際の業務で直面しやすい課題ごとに、MiniMax M3がどのように役立つかを整理します。

長文ドキュメントの全体把握の高速化

数百ページの技術マニュアルや法的文書を読み込んで要点を把握するのに、従来は何時間もかかっていた作業が、MiniMax M3の100万トークンコンテキストならドキュメント全体を1回のプロンプトで投入することができます。分割して投げ直す手間がなくなるため、文脈の途切れによる情報の欠落も防げるでしょう。

コーディングエージェントのAPI利用コスト削減

Claude OpusやGPT-5.5をコーディングエージェントのバックエンドに使うと、長時間のタスクでは1回あたり数ドル単位のコストが発生することも珍しくありません。

MiniMax M3は、プロモーション価格でOpusの約5%のコストで同等のタスクを処理できるため、高頻度のエージェントワークロードを現実的な予算内に収められます。

複数のツールやAPIをまたぐ自動化の効率化

MiniMax M3はMCP Atlas(エージェントプロトコル評価)で74.2%を記録しており、数百〜数千のAPIを1つのワークフロー内で正確にオーケストレーションする能力を備えています。金融監査の自動化や、複数プラットフォームにまたがるサプライチェーン連携といった複雑な業務フローの自動化に向いているでしょう。

MiniMax M3を使ってみた

それでは実際にMiniMax M3の実力を検証するため、MiniMax Agent(Mavis)を使ってコーディングタスクを試してみましょう。テーマとして、複数ファイルにまたがるバグ修正の指示を検証していきます。

検証用にPythonプロジェクトの3つのファイル(app.py、utils.py、config.py)を事前準備しています。

プロンプトはこちら
utils.pyのparse_date関数でタイムゾーンが考慮されていないバグがあるので修正して、影響のある他のファイルも合わせて直して
MiniMax M3を使ってみた
結果はこちら
MiniMax M3を使ってみた
MiniMax M3を使ってみた

MiniMax M3は、修正後に自ら動作確認のコマンドを実行し、「+09:00付きのtz-awareなdatetimeが返ってきて、ウィンドウ判定も残り時間も意味のある数値になっている」と結果を検証してくれています。単にコードを書き換えるだけでなく、テストまで自律的に実行するエージェント的な振る舞いが印象的でした。

さらに、設計判断のポイントとして「zoneinfoはPython 3.9+の標準ライブラリでpytz不要」「naiveを渡されても落ちない防御的ロジック」「入力にtzがある場合は尊重する拡張性」まで、実務の現場で求められるレベルの設計根拠を添えてくれたのは、コードレビュアーとしても活用できそうな水準だと感じました。

よくある質問

最後に、MiniMax M3に関して、多くの方が疑問に感じるポイントをQ&A形式でまとめました。

MiniMax M3は無料で使えますか?

はい、MiniMax Agent(Mavis)にアクセスすれば、ブラウザ上で無料でMiniMax M3を試すことができます。ただし、無料枠にはレート制限やコンテキスト上限が設定されている場合があります。本格的に利用する場合は、Token PlanやPay as You GoでAPIクレジットを購入する形になります。

MiniMax M3は日本語に対応していますか?

MiniMax M3は多言語に対応したモデルですが、前世代のM2.7では日本語出力時に中国語や韓国語が混入するケースがX上で報告されていました。M3での改善状況については、実際に試して確認することをおすすめします。コーディング用途であれば英語ベースのプロンプトが推奨されます。

MiniMax M3をローカル環境で動かすことはできますか?

はい、ウェイトの公開後はHuggingFaceからダウンロードして、SGLangやvLLMなどの推論エンジンでセルフホストが可能になる見込みです。ただし、トリリオンパラメータ級のMoEモデルであるため、100GB超のVRAMが必要になる可能性があり、ハイエンドなGPU環境が前提となります。また、商用利用にはMiniMaxの書面許可が必要なので、ライセンス条項を事前に確認してください。

MiniMax M3を活用してフロンティアAIを体験しよう!

MiniMax M3は、オープンウェイトモデルとして初めてフロンティアレベルのコーディング・100万トークンコンテキスト・ネイティブマルチモーダルの3機能を統合したモデルです。

SWE-Bench ProでGPT-5.5を上回り、BrowseCompでClaude Opus 4.7を超えるスコアを記録しながらも、API利用料は主要フロンティアモデルの数十分の1という価格設定を実現しています。

コーディングエージェントや長文ドキュメント分析、マルチモーダルワークフローの構築を検討している開発者にとって、高性能と低コストを両立させる現実的な選択肢といえるでしょう。

最後に

いかがだったでしょうか?

弊社では、AI導入を検討中の企業向けに、業務効率化や新しい価値創出を支援する情報提供・導入支援を行っています。最新のAIを活用し、効率的な業務改善や高度な分析が可能です。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

大規模言語モデル(LLM)比較レポート
LLM比較レポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

  • URLをコピーしました!
  • URLをコピーしました!
目次