【Claude Sonnet 4】コーディング・推論能力が大幅UPしたAnthropicのAIモデル!特徴から使い方まで解説

Claude Sonnet 4 コーディング 推論能力 Anthropic 特徴 使い方
押さえておきたいポイント
  • 従来モデルSonnet 3.7から大幅アップグレード
  • 「高速性」と「深い推論力」のバランスを兼ね備えたモデル
  • 標準モードでの応答速度は1秒未満と非常に高速

2025年5月23日、Anthropicは最新モデル「Claude Sonnet 4」をリリースしました!

今回、ハイエンド版「Claude Opus 4」と同時に登場したSonnet 4は、従来モデル以上に「高速性」と「深い推論力」のバランスを兼ね備えたモデルです。

前世代のSonnet 3.7が実現した「ハイブリッド推論」をさらに発展させ、用途に応じて即座に高速レスポンスを返したりじっくりと思考を深めたりと自在に調整可能なようです。

本記事では、Sonnet 4の特徴や性能、使い方を徹底解説します。

ぜひ最後までご覧ください。

目次

Claude Sonnet 4の概要

Claude Sonnet 4 は、Anthropicの最新世代「Claude 4 ファミリー」に属する汎用LLMです。

最大の特徴は、レスポンスを瞬時に返す「標準モード」と、より深い推論を数十秒単位で行う「拡張思考モード」を一つのモデルで切り替えられる点にあります。

これによって、チャットボットのような高速性が求められる場面では軽快に動き、複雑なコード修正や研究補助のようなシーンでは段階的に思考を深掘りする、といった柔軟な運用が可能になっています。

API だけでなく、Amazon BedrockやGoogle Cloud Vertex AIでもすでに提供されており、個人ユーザーはWeb/iOS/Androidから無償で試せるため、導入しやすいのも魅力です。

価格体系はSonnet 3系列が踏襲されており、入力100 万トークンあたり3USD、出力100 万トークンあたり15USD。開発者向けにはプロンプトキャッシュで最大90%、バッチ処理で50%の割引も提示されています。

Claude Sonnet 4の新機能

Claude Sonnet 4の新機能として、「自律的ツール選択能力」「長時間エージェント動作」の安定化が挙げられます。

まずツール選択では、外部API呼び出しやファイル操作をプロンプトなしで判断し、マルチステップのコード編集を従来モデルのClaude 3.7 Sonnet比で約2倍の成功率で完了します。

次に長時間エージェント動作においては、ローカルファイルアクセスを許可した状態で60分以上タスクを保持し、途中で作業が中断しても再開することが容易になりました。

さらに、200Kトークンのコンテキストは、書籍およそ2冊分の原稿や大規模コードベースを丸ごと渡しても失念しにくく、要所だけを抽出した「思考サマリー」を併記することで透明性も確保しています。

視覚認識能力では解析精度が向上し、複雑なグラフから数値を抽出するタスクで誤読率を30%から12%に削減されています。

こうした改良により、カスタマーサポート、データ分析、RPA、エージェント型コーディングなど多岐にわたる現場で “万能選手”として幅広い活躍が期待されています。

Claude Sonnet 4の性能

公開されたベンチマークテストでは、Claude Sonnet 4はコード修正やアルゴリズムの問題を解決するタスクにおいて、前世代のSonnet 3.7より大きく性能が向上しています。

特に、ソフトウェアエンジニアリング分野の難問ベンチマーク「SWE-bench Verified」では、合格率が約1.5倍に上昇し、他の同価格帯モデルGPT-4.1 miniGemini 2.5 Proと比較しても優れた結果を記録しています。

また、ツールを利用した複雑なタスク「METR Data Deduplication」での成功率も向上し、標準モードでの応答速度は1秒未満と非常に高速です。

拡張思考モードでも数秒で回答を生成できるため、リアルタイムな会話や実務での即戦力として十分な実用性を備えています。

以上整理すると、Sonnet 4は、速度、深度、コストのバランスが優れた高性能なモデルです。

AI Safety Levelについて

Claude Sonnet 4は、Anthropicが定めるAI Safety Levelにおいて、レベル2(ASL-2)に分類されています。

これは高度な安全基準を満たし、深刻な悪用リスクを十分に抑制していることを意味します。プラスアルファで専門家による厳格なセキュリティテストも経ており、危険な用途への回答を高精度で防止しています。

また、誤って適切な質問を拒否するケースを減らしつつ、不適切な質問には高い確率で無害な回答を返す調整がなされました。

開発者向けに思考過程を透明化するモードも提供されていて、安全性を維持しながら実用的な活用を支援してくれるのがClaude Sonnet 4となっています。

Claude Sonnet 4のライセンス

Sonnet 4は、SaaS/API形式での提供を前提としており、モデル自体の重みの配布は行われません。

そのため「改変」「再配布」に関しては一般的なOSS的ライセンスとは性質が異なる点に注意しましょう。

利用用途可否備考
商用利用⭕️API または Bedrock/Vertex AI 経由での SaaS 提供に準拠
改変❌️重みは非公開。プロンプト工夫や外部ツール統合は可
配布❌️SDK・API キーの譲渡も契約で禁止
特許使用⭕️
私的使用⭕️

※こちらの表は2025年5月時点の公開情報をベースにしています。

将来的にResponsible AI規制が強化された場合、ユーザー側にも新たな技術的・組織的セーフガードが求められる可能性があるため、ライセンス情報は定期的にチェックしておくことをおすすめします。

Claude Sonnet 4の料金

個人利用は無料または低コストで利用することができ、法人向けには管理機能などが付属しています。

用途に応じて適切なプランを選んでコストを最適化しましょう。

プラン名月額料金主な機能
無料プラン0円基本的な質問応答や簡単なタスク向け
Proプラン$20/月高度な推論や長文処理、優先アクセスあり
Teamプラン$30/ユーザー/月チームでのコラボレーションに便利
Enterpriseプラン要相談専用カスタムモデルや追加機能を提供
API入力$3/100万トークンフル機能を提供

API料金は従量課金ですが、バッチ処理やキャッシュを活用すると大規模ジョブのコストを40〜90 %削減できます。

FreeプランやProプランもトライアルとしては十分ですが、頻繁に長文や添付ファイルを扱う場合はProに移行した方がベターといえると思います。

Claude Sonnet 4の使い方

Claude Sonnet 4はWebUI Chatで使用するかAPIを用いた利用の2パターンの使い方があります。以下画像のようにWebUIでタブから選択すればOKです。

Claude Sonnet 4 APIを使って実装してみた

今回は、Claude Sonnet 4をAPI経由で実装していきます。

まずAnthropic APIキーを作成する必要があります。手順は以下の通りです。

1.Anthropicアカウント作成
ブラウザで https://console.anthropic.com へアクセスし、Google/Apple/メールアドレスのいずれかでサインアップします。メールの場合は届いた確認メール内のリンクをクリックして認証を完了させてください。

2.ワークスペースを作成
初回ログイン時に表示されるウィザード、または左サイドバーの Workspaces → Create workspace から任意の名前(例:personal-colab)を登録します。ワークスペース単位で利用上限とAPIキーを分けることができるので、検証用・本番用を分けておくと管理が楽になります。

3.API キーを発行
画面右上のアイコン → Account settings → API Keys を開き、➕ Create API key をクリック。

環境:Production か Developmentを選択(迷ったらDevelopmentでよいと思います)
確認ダイアログでキーが一度だけ表示されるので、必ずコピー して安全な場所に保存してください。

4.Colabにセット

GoogleColab画面左の歯車マーク(設定)→ シークレットタブ(鍵マーク) → 新しいシークレットを追加

KeyにANTHROPIC_API_KEY、Valueにコピーしたキーを貼り付け追加。
これでノートブックからは os.environ[“ANTHROPIC_API_KEY”] で参照できます。SDK は環境変数を自動で読み込むため、明示的にコードへ書き込む必要はありません

5.APIクレジット購入

Claude Sonnet 4はチャット UI(Web/iOS/Android)なら無料枠が使えます が、APIを呼ぶには必ず事前に「使用クレジット」をチャージする仕組みになっています。API利用する際は注意しましょう。

APIキーの設定は完了です。ここからColab上で実装していきます。

Colabは最初からPython 3.10・pipが使える状態なので、どの案でも最初の1行目は以下コードを記述します。

!pip install --upgrade anthropic

今回は挙動をみてみたいので、ミニマルノートブック版として実装していきます。

サンプルコードはこちら
!pip install -U anthropic -q   # 最新版SDK(0.25 以上)を保証

import os, getpass, anthropic, json

# 1. APIキー取得(環境変数→無ければ手入力)
api_key = os.getenv("ANTHROPIC_API_KEY") or getpass.getpass("API key: ")

# 2. クライアント生成
client = anthropic.Anthropic(api_key=api_key)

# 3. 呼び出し関数
def ask_claude(prompt: str) -> str:
    resp = client.messages.create(
        model="claude-sonnet-4-20250514",       
        max_tokens=512,
        messages=[{"role": "user", "content": prompt}],
        temperature=0.7                     # 必要なら調整
        # extra_headers には **正式なβ名** だけを渡す
    )
    # 念のため応答に含まれるモデルIDを確認
    print("Model ID returned:", resp.model)
    return resp.content

print(ask_claude("Claude Sonnet 4 ですか?"))
結果はこちら
Model ID returned: claude-sonnet-4-20250514
[TextBlock(citations=None, text='いいえ、私はClaude 3.5 Sonnetです。現在のところ、Claude 4やClaude Sonnet 4というモデルは存在していません。\n\n私はAnthropic社によって開発されたClaude 3.5 Sonnetで、2024年にリリースされたモデルです。何かお手伝いできることがあれば、お気軽にお聞かせください。', type='text')]

意図していないClaude 3.5 Sonnetが登場しました。設定は間違っていないはずですが・

念のため以下コマンドを実行して、利用可能なモデル一覧をみてみましょう。

!pip install -U anthropic -q             
from anthropic import Anthropic
import os, getpass, json

key = os.getenv("ANTHROPIC_API_KEY") or getpass.getpass("API key: ")
cli = Anthropic(api_key=key)

# 利用可能なモデル一覧を取得
print(json.dumps([m.id for m in cli.models.list()], indent=2))

問題なく使えるはずですが、キャッシュの削除やColab自体のランタイム再起動なども試しても上記の結果は変わりませんでした。

また、Anthropicワークベンチ(https://console.anthropic.com/workbench/)でも試しましたが、以下画像の通り、また3.5 Sonnetが呼び出されてしまいました

どうやら、応答本文で古いバージョンを名乗るケースがあるが、resp.modelが実際に稼働しているモデルであるとのこと。API仕様上、modelフィールドには「実際に推論を行ったモデルID」が必ず入る公式ドキュメントにも明記されています。

以下のようにフィールドを確認して、”model returned: claude-sonnet-4-20250514″と表示されていれば、問題なく”claude-sonnet-4-20250514″を選択できていますので、ご自身の環境でも確認してみてください。

def ask_claude(prompt: str) -> str:
    resp = cli.messages.create(
        model="claude-sonnet-4-20250514", 
        max_tokens=1024,
        messages=[{"role": "user", "content": prompt}],
        temperature=0.7
    )
    # 応答ヘッダーでモデルIDを確認
    print("◆ model returned:", resp.model)
    return resp.content

print(ask_claude("claude-sonnet-4-20250514はあなたですか?"))

WebUI チャット版

ここからは「WebUI Chat」でもSonnet 4を試してみましょう。

プロンプトはこちら
Claude Sonnet 4として、あなたの強みを3点教えてください。
結果はこちら
Claude Sonnet 4として、私の主な強みは以下の3点です:
1. 効率的で実用的な問題解決
日常的なタスクから複雑な分析まで、幅広い問題に対してバランスの取れたアプローチで効率的に対応できます。コーディング、文書作成、データ分析、創作活動など、様々な分野で実用的なソリューションを提供します。
2. 自然で柔軟なコミュニケーション
文脈に応じて適切なトーンや形式で対話でき、カジュアルな会話から専門的な議論まで、相手のニーズに合わせて自然にコミュニケーションを取ることができます。複雑な概念も分かりやすく説明し、具体例や比喩を使って理解を促進します。
3. 高品質なコンテンツ創作能力
技術文書、創作物、分析レポート、インタラクティブなアプリケーションなど、様々な形式の高品質なコンテンツを作成できます。特に、実際に動作する完全な機能を持つアプリケーションやツールの開発が得意です。
これらの強みを活かして、あなたの具体的な課題やプロジェクトをサポートできます。何かお手伝いできることがあれば、お気軽にお声かけください。

画像読み込みから3Dイメージ生成を試してみます。

プロンプトはこちら
このイメージを3D線画だけで描いて

入力画像の世界観を崩さず、ピラミッドや人物の特徴を捉えて3D線画化することができています。さらに、マウス操作で視点を回転することもできるようにしてくれています。

動画は早送りしていますが、出力まで約20秒ほどでした。

続いて、Claude 4系はベータ版の「code-executionツール」を呼び出すと、返答の中で自動生成したPythonを安全なサンドボックスで走らせ、その結果を再入力に使うことができるので、サンドボックスPython実行を試してみます。

サンプルコードはこちら
あなたは安全なPythonサンドボックスを使うことができます。
次の要件を満たすスクリプトを作成し、実際に実行して結果を表示してください。

【要件】
1. 関数 `primes_upto(n:int)` を実装し、2 以上 n 以下の素数を昇順リストで返す  
2. `n = 100` で呼び出し、戻り値を変数 `result` に格納  
3. `result` を逆順に並べ替えたリスト `rev` も作成  
4. 以下を順番に表示  
   - 元の `result`  
   - 逆順リスト `rev`  
   - 実行時間(ミリ秒換算)

【出力フォーマット】
```python
# 実行した Python コード

# === 実行結果 ===
result: [...]
rev:    [...]
elapsed_ms: ###
結果はこちら
##実行用スクリプト
import time

def primes_upto(n: int):
    """2以上n以下の素数を昇順リストで返す"""
    if n < 2:
        return []
    
    # エラトステネスの篩を使用
    sieve = [True] * (n + 1)
    sieve[0] = sieve[1] = False
    
    for i in range(2, int(n**0.5) + 1):
        if sieve[i]:
            for j in range(i*i, n + 1, i):
                sieve[j] = False
    
    return [i for i in range(2, n + 1) if sieve[i]]

# 実行時間を測定
start_time = time.time()

# n = 100で素数を取得
result = primes_upto(100)

# 逆順リストを作成
rev = result[::-1]

end_time = time.time()
elapsed_ms = (end_time - start_time) * 1000

# 結果を表示
print("=== 実行結果 ===")
print(f"result: {result}")
print(f"rev:    {rev}")
print(f"elapsed_ms: {elapsed_ms:.3f}")




##実行結果
result: [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97]
rev:    [97, 89, 83, 79, 73, 71, 67, 61, 59, 53, 47, 43, 41, 37, 31, 29, 23, 19, 17, 13, 11, 7, 5, 3, 2]
elapsed_ms: 0.024
実行が完了しました。エラトステネスの篩を使って効率的に2以上100以下の素数25個を取得し、逆順リストも正しく作成されています。実行時間は約0.024ミリ秒でした。

いい感じです、問題なく推論できていますね。

実行時間も数秒程度でかなり早く、「高速性」と「深い推論力」のバランスの良さを感じました。

Claude Sonnet 4の注意点

Sonnet 4は、拡張思考モードでツールを呼び出す際、外部実行結果を鵜呑みにして誤った前提で推論を続ける例が稀にあるようです。

API連携でファイル書き込み権限を与える場合は、Sandboxディレクトリを限定し、ステートマシンでロールバックを保証するようにしましょう。

また、AI安全基準のASL-2(AI Safety Level 2)を満たしていても、不正な命令による制限突破を完全に防げるわけではありません

そのため、ファイルの内容を直接プロンプトに入力する場合には、悪意のあるシステム命令などを事前に検知・除去するフィルタ処理を必ず行うようにしましょう。

Claude Sonnet 4についてよくある質問

Claude Sonnet 4を使う際によくある質問や気になるポイントをまとめました。  

Opus 4 と迷っています。どちらを選ぶべき?  

特にリスクが高く厳密さが求められる業務や、精度の限界に挑戦するような研究開発でなければ、コストパフォーマンスに優れたSonnet 4を選ぶのがよいでしょう。

200Kトークンはどのくらいのサイズ?

日本語の単行本約2冊分、Markdownだと400KB程度のサイズ感です。

拡張思考モードで料金は変わる?

トークン従量課金なので、思考過程が長いほどコストは増えますが、同じ出力量なら料金は同一です。 

セキュリティは大丈夫?  

Claude Sonnet 4は安全性に配慮しています。ただし、個人情報や機密情報を扱う際は注意が必要です。利用する前にAnthropicのプライバシーポリシーを確認して、適切に管理しましょう。  

どんなことに使える?  

プログラミングのコード作成や数学の問題、複雑な議論の整理など、さまざまな用途に活用できます。特に、拡張思考モードを使うことで、複雑なタスクにも丁寧に対応してもらえます。

まとめ

Claude Sonnet 4は「速度」「推論深度」「価格」の三拍子が揃った汎用モデルです。

拡張思考モードの可視性やASL-2適用による安全策も整っており、スタートアップの実験から大企業の運用までさまざまな開発フローを構築することができます。

同時リリースされたOpus 4との棲み分けを意識しつつ、まずは無料プランで体験し、ご自身のユースケースでの付加価値を測ることをおすすめします。

最後に

いかがだったでしょうか?

Claude Sonnet 4を活用することで、複雑なデータ分析や業務の自動化が可能になり、意思決定の精度向上や業務効率化に役立ちます。貴社の課題に最適なAI活用法をご提案し、競争力強化を支援します。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

まずは、無料相談にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

大規模言語モデル(LLM)比較レポート
LLM比較レポート

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。

投稿者

  • WEEL Media部

    株式会社WEELが運営する生成系AI関連メディア「生成AI Media」は、AIの専門家によるWebメディアです。 AIに特化した編集部がAIの活用方法、導入事例、ニュース、トレンド情報を発信しています。

  • URLをコピーしました!
  • URLをコピーしました!
目次