【GLM-5.2】Fable 5停止の翌日に緊急公開!100万トークン対応コーディングモデルを徹底解説

GLM-5.2 Fable 5 停止 翌日 緊急 公開 100万トークン 対応 コーディングモデル 徹底 解説
押さえておきたいポイント
  • Z.ai(Zhipu AI)が2026年6月13日に公開したGLM-5シリーズの最新フラッグシップモデル
  • コンテキストウィンドウが従来の20万トークンから100万トークンへ大幅拡張
  • MITライセンスでのオープンウェイト公開が予告されており、商用利用も可能

2026年6月13日、中国のAI企業Z.aiが、100万トークンのコンテキストに対応するコーディング特化のフラッグシップモデル「GLM-5.2」を発表しました!

2026年6月16日時点で公式Xの投稿には8,200件以上のいいねが集まるなど、世界中の開発者から大きな注目を浴びています。

とはいえ、「GLM-5.1と何が変わったの?」「日本語でも実用的に使えるの?」と気になっている方も多いのではないでしょうか。

この記事では、GLM-5.2の概要やアーキテクチャ、料金体系、ライセンス、具体的な使い方から業界別の活用シーンまで徹底解説します。最後まで読むことで、GLM-5.2の導入判断に必要な情報をすべて押さえられるはずです。ぜひ最後までご覧ください!

\生成AIを活用して業務プロセスを自動化/

目次

GLM-5.2とは?

GLM-5.2とは?

GLM-5.2は、中国・北京に拠点を置くAI企業Z.aiが2026年6月13日に公開した、GLM-5ファミリーの最新フラッグシップモデルです。GLM-5シリーズとしては、2026年2月のGLM-5、3月のGLM-5-Turbo、4月のGLM-5.1に続く4番目のリリースとなっています。

最大の進化ポイントは、コンテキストウィンドウがGLM-5.1の20万トークンから100万トークンへと5倍に拡張された点にあります。最大出力トークン数も131,072トークンに達しており、大規模なリポジトリ全体を一度に読み込んだうえでのコード修正や、数時間にわたるエージェントタスクの継続実行が可能な設計となっています。

なお、2026年6月16日時点ではGLM Coding Plan加入者向けに先行提供されている段階で、スタンドアロンAPI・チャットボット・MITライセンスでのオープンウェイト公開は翌週(6月第3週)に予定されています。

GLM-5.2の仕組み

GLM-5.2の仕組み

GLM-5.2のアーキテクチャは、GLM-5から継承された744億パラメータのMixture-of-Experts(MoE)構成を基盤としています。全体で384個のエキスパートモジュールを持ちながら、推論時に実際にアクティブになるのは1トークンあたり約400億パラメータにとどめることで、計算効率と性能のバランスをとっています。

長大なコンテキストを効率よく処理するために、DeepSeek Sparse Attentionと呼ばれるスパースアテンション機構が組み込まれています。

通常のTransformerでは全トークン間の関係を計算するため、コンテキスト長が伸びると計算コストが急増しますが、この機構によりトークン間の注意計算を選択的に行い、100万トークン規模のコンテキストでも実用的な推論速度を維持できるよう設計されています。

また、推論の深さを制御するための2段階のThinking Effort(High・Max)が新たに導入されました。コーディングタスクでは、より深い推論を行うMaxモードの使用が以下のポストでも推奨されています。

注目すべき点として、GLM-5シリーズはNVIDIAのGPUを一切使用せず、Huawei Ascend 910Bチップ上でMindSporeフレームワークを用いて学習されているそうです。サプライチェーンの独立性という観点からも、国際的な半導体規制の影響を受けにくいモデルとして位置づけられています。

GLM-5.2の特徴

GLM-5.2の特徴

GLM-5.2が目指す方向性は、単発の回答精度ではなく、長時間にわたるエージェント的タスクの安定実行にあります。

100万トークンという広大なコンテキストウィンドウを活かし、中規模のリポジトリ(40ファイル程度のPythonプロジェクトなど)を丸ごと1つのセッションに読み込んだうえで、ファイル間の依存関係を追跡しながらリファクタリングを行えるのが大きな強みです。

GLM-5.2の特徴
参考:https://docs.z.ai/guides/llm/glm-5.1

また、「計画→実行→テスト→修正」のループを長時間にわたって持続するロングホライズンタスクに特化した設計がなされており、GLM-5.1の時点でSWE-Bench Proにおいて58.4%を記録し、GPT-5.4(57.7%)やClaude Opus 4.6(57.3%)を上回った実績があります。

GLM-5.2自体の公式ベンチマークスコアはリリース時点で公開されていません

対応するコーディングエージェントも幅広く、Claude Code・Cline・OpenClaw・OpenCode・Roo Code・Kilo Codeなど8種類以上のツールに初日からエンドポイント設定のみで接続可能な点も、開発者にとって導入しやすいポイントとなっています。

Claude Fable 5の規制停止とGLM-5.2のタイミングが話題に

GLM-5.2のリリースが大きな注目を集めた背景には、モデルの性能以上にタイミングが関係しています。GLM-5.2が公開された2026年6月13日は、AnthropicのClaude Fable 5およびClaude Mythos 5が米国政府の輸出規制命令により全ユーザー向けに提供停止となったのとほぼ同日でした。

Z.aiの創業者であるJie Tang氏は、GLM-5.2の発表に際して「特定のフロンティアモデルに対する突然の制限を深く遺憾に思います」「AGIへの道は高い壁で囲まれるべきではなく、フロンティアインテリジェンスはオープンソースであり、アクセス可能であり、あらゆる開発者に奉仕するものでなければなりません」と声明を発表しており、規制への対抗としてオープンモデルの重要性を強く打ち出しています

今回解説する事例において、弊社がX(旧Twitter)で発見した参考となるツイートを紹介させていただいております。取り下げなどのご連絡は、contact@weel.co.jp からご連絡ください。

X上ではこの件に関する投稿が相次いでおり、日本のユーザーからも「Fableなき今は複数モデル使う環境だし、じっくり見たいところ」といった反応が見られます。

また、一部のベンチマーク(BridgeBench)でFable 5を上回ったとする報告についても「実使用でそんな性能は出ないのでしょうけど」と冷静に分析する声や、「コスパとコンテキスト長を最重視するならGLM-5.2」とFableの代替候補に挙げる声もあり、Claude Fable 5のサービス停止というAI業界の激震の中でGLM-5.2がどう使えるかという文脈で盛んに議論されています。

GLM-5.2の安全性・制約

GLM-5.2はMITライセンスでのオープンウェイト公開が予告されており、透明性の高い運用が期待されます。ただし、2026年6月16日時点ではモデルウェイトはまだ公開されておらず、「翌週公開」というコミットメントの段階にとどまっています。

また、GLM-5.2のリリース時には公式なセーフティレポートやRed Teamingの結果が公表されていません。フラッグシップモデルをベンチマークスコアなしで先行公開するという手法について、海外の開発者コミュニティからは「マーケティング先行ではないか」という指摘も出ており、独立した第三者評価が待たれる状況です。

日本語の処理効率にも注意が必要です。GLMシリーズのTokenizerは中国語・英語のトークン語彙が中心であるため、日本語の1文字が3〜5トークンに膨らむ傾向があり、100万トークンの実質的な日本語入力可能文字数は限定される点を考慮する必要があります。

GLM-5.2の料金

GLM-5.2は、Z.aiのGLM Coding Planというサブスクリプション型プランを通じて提供されています。

従量課金のAPI料金ではなく、月額定額制のプランに含まれる形で利用でき、追加料金なしでGLM-5.2を使用可能です。米国フロンティアモデルの同等サブスクリプション(Claude ProやClaude Max)と比較すると、おおよそ1/10程度のコストで利用できるのが大きな特徴となっています。

スクロールできます
プラン月額料金(Monthly契約の場合)5時間あたりプロンプト上限週間プロンプト上限
Lite約$16約80回約400回
Pro約$64約400回約2,000回
Max約$144約1,600回約8,000回
Team要問い合わせ(シートベース)要問い合わせ要問い合わせ
GLM-5.2の料金

2026年6月時点では四半期契約による割引も提供されています。全プランでGLM-5.2のほか、GLM-5.1・GLM-5-Turbo・GLM-4.7・GLM-4.5-Airなど複数モデルを利用可能ですが、GLM-5.2はOpusレベルの上位モデルとして扱われるため、クォータの消費倍率が高めに設定されている点に注意が必要です。ルーティン作業にはGLM-4.7を、複雑なタスクにはGLM-5.2を使い分けることが公式に推奨されています。

GLM-5.2のライセンス

GLM-5.2はMITライセンスでのオープンウェイト公開が公式に予告されています。

MITライセンスは、ソフトウェアライセンスの中でも最も制約が緩い部類に入るもので、商用利用から改変まで幅広い用途に対応しています。前世代のGLM-5.1もHugging Face上でMITライセンスにて公開された実績があり、GLM-5.2もこの方針が継続される見込みです。

スクロールできます
利用形態可否
商用利用⭕️
改変⭕️
再配布⭕️
特許利用🔺(MITライセンスに明示的な特許条項はないため、別途確認推奨)
私的利用⭕️
GLM-5.2のライセンス

2026年6月16日時点では、オープンウェイトの公開はまだ実施されておらず、GLM Coding Plan経由でのアクセスのみとなっています。MITライセンスでの公開は翌週予定とされていますが、実際にHugging Faceなどのリポジトリに公開されたことを確認してから利用計画を立てるのが安全です。

GLM-5.2の使い方

GLM-5.2は2026年6月16日時点では、GLM Coding Planのサブスクリプション経由で利用可能です。対応するコーディングエージェントの設定ファイルを編集するだけで、既存のワークフローを変えずにモデルだけをGLM-5.2に切り替えられるのが大きなメリットとなっています。

Claude CodeでGLM-5.2を使う方法

STEP
GLM Coding Planに加入する

Z.aiの公式サイトにアクセスし、Lite・Pro・Maxのいずれかのプランに加入します。

STEP
Claude Codeの設定ファイルを編集する

ターミナルで以下のファイルを開きます。

vim ~/.claude/settings.json

以下の内容を追加もしくは上書きします。

{
  "env": {
    "CLAUDE_CODE_AUTO_COMPACT_WINDOW": "1000000",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.2[1m]",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.2[1m]"
  }
}

モデル名に[1m]を付与することで100万トークンのコンテキストが有効化されます。CLAUDE_CODE_AUTO_COMPACT_WINDOW"1000000"に設定することも忘れないようにしましょう。

STEP
モデルの切り替えを確認する

新しいターミナルウィンドウを開き、claudeコマンドを実行します。起動後、/statusと入力すれば現在のモデルがGLM-5.2になっていることを確認できます。

GLM-5.2の使い方
参考:https://docs.z.ai/devpack/latest-model
STEP
Thinking Effortを調整する

Claude Codeのセッション内で/effortコマンドを実行すると、推論の深さを切り替えられます。コーディングタスクではmaxへの切り替えが推奨されています。

OpenClawでGLM-5.2を使う方法

STEP
ファイル編集

OpenClawを利用している場合は、以下のファイルを編集します。

vim ~/.openclaw/openclaw.json

models.providers.zai.models配列に以下のオブジェクトを追加します。

{
  "id": "glm-5.2",
  "name": "GLM-5.2",
  "reasoning": true,
  "input": ["text"],
  "cost": {"input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0},
  "contextWindow": 1000000,
  "maxTokens": 131072
}

さらに、agents.defaults.model.primary"zai/glm-5.2"に変更し、openclaw gateway restartでゲートウェイを再起動すれば設定完了です。

ClineなどOpenAI互換ツールでGLM-5.2を使う方法

Clineなど、OpenAI互換のカスタムモデル設定に対応したツールでは、以下の設定を行うことでGLM-5.2を利用できます。

スクロールできます
項目設定方法
API ProviderOpenAI Compatibleを選択
Base URLhttps://api.z.ai/api/coding/paas/v4
API KeyZ.AIのAPIキーを入力
ModelCustom Modelを選択し、glm-5.2と入力
Context Window Size1000000に設定
Support Imagesチェックを外す
ClineなどOpenAI互換ツールでGLM-5.2を使う方法

【業界別】GLM-5.2の活用シーン

GLM-5.2は100万トークンのコンテキストとコーディング特化の設計を活かし、さまざまな業界で活用が期待できます。ここからは、業界ごとの具体的なユースケースを紹介します。

ソフトウェア開発

GLM-5.2のもっとも直接的な活用先がソフトウェア開発の現場です。

100万トークンのコンテキストを活かし、中規模リポジトリ全体を一度に読み込んだうえでのクロスファイルリファクタリングや依存関係の整理が可能になるでしょう。Claude CodeやClineなど使い慣れたツール上でモデルだけを差し替えられるため、ワークフローを大きく変えずに導入できるのもメリットです。

生成AIを搭載したSaaSについて、詳しく知りたい方は以下の記事も参考にしてみてください。

研究・教育

MITライセンスでのオープンウェイト公開が実現されれば、大学の研究室や教育機関でのモデル研究・ファインチューニングの素材として活用できるでしょう。また、NVIDIAチップを使わずにHuawei Ascendで学習された独自のアーキテクチャは、ハードウェア多様性の研究テーマとしても興味深い対象です。

教育業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

金融・コンサルティング

長大なレポートや契約書の分析にも100万トークンのコンテキストはありがたいですよね。

ただし、日本語のトークン効率の問題(1文字あたり3〜5トークン消費)には留意が必要で、日本語メインの業務では実質的なコンテキスト容量が縮小する点を事前に検証しておくことが推奨されます。

金融業界における生成AI活用について、詳しく知りたい方は以下の記事も参考にしてみてください。

【課題別】GLM-5.2が解決できること

GLM-5.2が解決を得意とする課題を具体的に整理しておきましょう。自社の業務課題と照らし合わせて、導入の検討材料にしてみてください。

Claude Code利用時のサブスクリプションコスト削減

Claude ProやMaxのサブスクリプション費用が負担になっている開発者にとって、GLM Coding Planは同じClaude Codeのインターフェースを維持しながら、コストを大幅に削減できる選択肢となるでしょう。Liteプラン(月額$10)であっても、Claude Proの約3倍の5時間あたりプロンプト枠が利用可能となっています。

大規模コードベースの一括リファクタリング

GLM-5.2が持つ100万トークンのコンテキストウィンドウにより、従来は分割して処理する必要があった数十ファイルにまたがるリポジトリ全体を一度に読み込んで修正するタスクが実用的になるでしょう。ファイル間の依存関係を見失わずに一貫性のある変更を加えられるのは、長大なコンテキストならではの強みです。

フロンティアモデルのアクセス遮断リスクに備える

Claude Fable 5の突然サービス停止となったように、クローズドモデルには政策変更や規制による突然のアクセス遮断リスクがつきまといます。GLM-5.2のMITライセンスでのオープンウェイト公開が実現すれば、ローカル環境やプライベートクラウドでの自前運用も視野に入り、外部依存リスクの軽減につながるでしょう。

よくある質問

最後に、GLM-5.2に関して、多くの方が疑問に感じるポイントをQ&A形式でまとめました。

GLM-5.2は無料で使えますか?

2026年6月16日時点では、GLM Coding Plan(月額$10〜)への加入が必要です。ただし、MITライセンスでのオープンウェイト公開が翌週予定されており、公開後はローカル環境での無料利用も可能になる見込みです。なお、744Bパラメータのモデルをローカルで動かすには相応のGPUリソースが必要となる点にはご注意ください。

GLM-5.2とClaude Opus 4.8、どちらを選ぶべきですか?

用途によって異なります。コストを重視しつつコーディングタスクを中心に使いたい場合はGLM-5.2が有力な選択肢です。一方、深い推論や多段階の分析、マルチモーダル対応が求められる場合はClaude Opus 4.8に分があります。2026年6月時点ではGLM-5.2の独立したベンチマークがまだ少ないため、実際のタスクで両者を試して判断するのがベストです。

日本語の処理は問題なくできますか?

日本語での利用自体は可能ですが、Tokenizerの語彙の構成上、日本語のトークン消費効率が中国語・英語と比べて低いという制約があります。日本語メインの長文処理ではコンテキスト容量やAPI費用への影響を事前に確認することを推奨します。

GLM-5.2でオープンモデルの可能性を探ろう!

GLM-5.2は、100万トークンのコンテキスト・MITライセンス・月額$10からの低コストという三拍子を揃えた、コーディング特化のフラッグシップモデルです。Claude Fable 5のサービス停止という激動のタイミングで登場したこともあり、クローズドモデルへの依存リスクを再考するきっかけとしても注目を集めています。

ただし、リリース時点で公式ベンチマークが公開されていない点や、日本語トークン効率の課題など、導入前に確認すべき点も残されています。API公開やオープンウェイトのリリースが予定通り進めば、2026年後半のコーディングAI市場において有力な選択肢となることは間違いありません。

最後に

いかがだったでしょうか?

弊社では、AI導入を検討中の企業向けに、業務効率化や新しい価値創出を支援する情報提供・導入支援を行っています。最新のAIを活用し、効率的な業務改善や高度な分析が可能です。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

生成AIを活用したプロダクト開発の支援内容は、以下のページでも詳しくご覧いただけます。
➡︎株式会社WEELのサービスを詳しく見る。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

大規模言語モデル(LLM)比較レポート
LLM比較レポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

  • URLをコピーしました!
  • URLをコピーしました!
目次