【Claude 3】GPT-4を超えるAnthropicのOpus、Sonnet、Haikuとは?使い方や料金も解説

Claude-3 GPT-4 超える LLM 徹底比較

WEELメディア事業部LLMリサーチャーの中田です。

3月4日、次世代の大規模言語モデル「Claude 3」を、Anthropicが公開しました。特に、Claude 3 Opusは、様々な業界ベンチマークでSOTAを達成しており、GPT-4よりも高い性能を発揮しているんです!

公式Xでの投稿のいいね数は、9800を超えており、かなり期待されていることが分かります。

この記事ではClaude 3の使い方や、有効性の検証まで行います。本記事を熟読することで、Claude 3の凄さを理解し、ChatGPTには戻れなくなるでしょう。ぜひ、最後までご覧ください。

目次

Claude 3の概要

元OpenAIエンジニアのAIスタートアップ「Anthropic」が、大規模言語モデルの「Claude 3」を公開しました。

今回公開されたClaude 3の新モデルには、以下の3つのモデルが含まれます。

モデル性能回答速度
Claude 3 Opus最も性能が高く、GPT-4よりも強力Claude 2.1と同等
Claude 3 Sonnet次に性能が高く、Gemini 1.0 Proよりも強力Claude 2.1の2倍速い
Claude 3 Haiku軽量で高速ながら、Gemini 1.0 Proよりも強力約1万トークンを3秒以内に読める

これらのモデルの違いとしては、Opus→Sonnet→Haikuの順に精度が高いですが、コストも同順で高くつきます。

参考:https://www.anthropic.com/news/claude-3-family

また、Opusモデルに関しては、全てのベンチマークにおいてGemini 1.0 UltraやGPT-4よりも高い性能を誇っています。

画像認識の精度

Claude 3モデルには新たな機能として、画像と文章を同時に処理できるマルチモーダル機能が追加されたとのことです。写真やチャート、グラフなど、様々な形式の画像を処理することができます。

上図を見ると、Claude 3 OpusはGPT-4Vよりも、高い画像認識性能を持っていることが分かります。

その他Claude 3のポイント

さらに、以前のClaude 2.1では「無害なプロンプトを誤って拒否する」という課題がありましたが、Claude 3ではかなり改善されていることが分かります。下の図の縦軸が「無害なプロンプトを誤って拒否する割合」を表しています。

加えて、Opusモデルの場合、Claude 2.1に比べて、「複雑な質問」への回答精度が2倍の精度に向上したそう。

また、従来モデルと同様、20万トークンまで対応していますが、場合によっては100万トークン以上に対応しているとのこと。※1

なお、AnthropicのClaude 2について詳しく知りたい方は、下記の記事を合わせてご確認ください。
Claude 2の日本での使い方解説!料金体系やセキュリティ、ChatGPTとの違いについても解説

Claude 3のライセンス

Claude 3のライセンスに関する情報は公式サイトには記載されていませんでしたが、利用規約を各員すると禁止されている利用用途や商用利用について詳しく記載があるので、利用前にしっかり確認しましょう。

参考:Claude Acceptable Use Policy

また、前述の通りClaude3の各モデルで利用料金が異なります。利用料金については、以下の通りです。

モデル100万トークンあたり入力コスト100万トークンあたり出力コスト
Claude 3 Opus15ドル75ドル
Claude 3 Sonnet3ドル15ドル
Claude 3 Haiku0.25ドル1.25ドル
参考:https://www.anthropic.com/news/claude-3-family

Claude 3の使い方

Claude 3を利用する方法としては、以下のような方法があります。

  • Claude公式Webブラウザ版のClaude.AI
  • Claude のAPIを利用
  • AWSのBedrock
  • GoogleのVertex AI

ちなみに、AWSのBedrockでの利用に関して、2024年4月7日現在では、SonnetとHaikuのみ利用可能で、Opusについては近日リリース予定とのことです。※2

また、Google CloudのVertex AIのアナウンスメントでも、「後数週間内に、Vertex AI Model GardenのAPIアクセスを通じて、Claude 3の全てのモデルすべてを利用可能になる」とのこと。

At Google Cloud, we’re committed to empowering customer choice and innovation through our curated collection of first-party, open-source, and third-party models available in Vertex AI. That’s why we’re thrilled to announce that Claude 3 — Anthropic’s new family of state-of-the-art models — will be generally available in Vertex AI Model Garden over the coming weeks, including private preview access for one of the models starting today.

引用:Announcing Anthropic’s Claude 3 models on Google Cloud Vertex AI

2024年4月7日現在では、Vertex AIでもSonnetとHaikuのみ可能となりました。※3

今回は、Claude公式のWebブラウザ版のチャットを利用したいと思います。まず、claude.aiにアクセスしてください。以下の画面に移動するので、登録を行いログインをしましょう。

以下の「Get API Keys」でAPIキーを取得できます。

「Start Prompting with Claude」をクリックすると、以下のUIに移動します。

左上の「Model」のプルダウンメニューから、Claudeのモデルを選択できます。Claude.AIからの利用であれば、無料でSonnetを利用できるので、課金に抵抗がある方は無料版のSonnetを利用すると良いでしょう。一番性能の高いOpusを利用する場合は、Claude Pro(月額20ドル)に加入する必要があります。今回は課金してOpusを試してみます。

試しに、日本語で「現在の日本の総理大臣は誰ですか?」と質問してみます。結果は以下の通りです。

現在の日本の総理大臣は岸田文雄(きしだ ふみお)氏です。

岸田文雄氏は、2021年10月4日に第100代内閣総理大臣に就任しました。岸田氏は自由民主党総裁選挙で勝利し、国会での指名選挙を経て総理大臣に選出されました。

岸田氏は1957年7月29日生まれ、広島県出身です。東京大学法学部を卒業後、通商産業省(現在の経済産業省)に入省しました。その後、政界入りし、衆議院議員を務めています。岸田氏は安倍内閣と菅内閣で外務大臣を務めた経験があります。

自由民主党の有力な派閥である宏池会に所属し、党内でも影響力のある政治家の一人です。総理大臣就任後は、新型コロナウイルス対策や経済政策などに取り組んでいます。

日本語にも対応しているようで、「文章も自然である」と一部のユーザーから評価されています。

なお、ChatGPT超えのClaude 2.1について詳しく知りたい方は、下記の記事を合わせてご確認ください。
【Claude 2.1】ChatGPT超えAIの日本語での使い方やAPIの使用方法、GPT-4との比較を解説

GPT-4、Gemini UltraとClaude 3を比較してみた

Claude 3の威力を検証するために、Opusモデルと、以下の2つを比較しました。
→実際のClaude 3活用事例はこちら

  • GPT-4
  • Gemini Ultra 1.0

検証内容として、以下の3つのタスクを実行させました。

  • 画像認識(名刺読み取り)
  • 画像認識の深層学習モデルの構築
  • 日本語のポエム作成

それでは順番に見ていきましょう。

画像認識(名刺読み取り)

まずは、以下の名刺を画像として読み込ませ、名刺の形式に沿って文字起こしをさせようと思います。

使用するプロンプトは、以下の通りです。

Please transcribe all of these business cards and output them as a code block with the format as well.
和訳:

この名刺をすべて文字起こしし、形式も合わせてコードブロックとして出力してください。

それぞれの結果は、以下の通りです。

左がClaude 3、右上がGPT-4、右下がGemini Ultraの結果です。Gemini Ultraだけ、正しく出力できませんでした。

画像認識の深層学習モデルの構築

CIFAR-10を用いて画像認識モデルを構築し、「どちらのLLMで構築したモデルの方が、精度が高いのか」を検証します。

使用したプロンプトは、以下の通りです。

Create a deep learning model of image recognition using the CIFAR-10 dataset, which is readily available in PyTorch. In doing so, please make the model as accurate as possible.
和訳:

PyTorchで簡単に利用できるCIFAR-10データセットを使用して、画像認識のディープラーニングモデルを作ってください。その際、できるだけ精度の高いモデルを作ってください。

Claude 3 Opusの結果は以下の通りです。

GPT-4の結果は以下の通りです。

Gemini Ultra 1.0の結果は以下の通りです。

各コードをGoogle Colabで実行した際の、テストセットの結果は、以下の通りです。

  • Claude 3 Opus:92 %
  • GPT-4:61 %
  • Gemini Ultra 1.0:74.23 %

ChatGPTのGPT-4で生成したモデルが一番精度が低く、Claude 3 Opusで生成したモデルの精度が最も高い結果となりました。

日本語のポエム作成

最後に、日本語の短い恋愛ポエムを出力させようと思います。

使用したプロンプトは、以下の通りです。

Make a short love poem in Japanese.
和訳:

短い恋愛ポエムを日本語で作ってください。

Claude 3 Opusの結果は以下の通りです。

君の笑顔に

心奪われて

気づいたんだ

恋をしてると

出会いは突然

言葉は少なく

でも確かに

通じ合える

離れていても

心は一つ

いつの日にか

結ばれるように

GPT-4の結果は以下の通りです。

春の夜、

花びら舞う中、

君と手を繋ぐ。

月明かりに照らされ、

二人の影が一つに。

永遠の愛、誓う時。

心から、心へ、

言葉越える想い、

君に捧げる、この詩。

Gemini Ultraの結果は以下の通りです。

春風に誘われ

桜並木を歩く

君と並んで歩く

ただそれだけで幸せ

あなたの笑顔

あなたの笑顔は

太陽よりも輝いて

私の心を照らす

あなたの笑顔が大好き

永遠の愛

あなたを愛してる

この気持ちは永遠に

変わらない

ずっと一緒にいよう

運命の出会い

あなたとの出会いは

運命だったと信じてる

離れられない

ずっと一緒だよ

愛の言葉

愛してる

大好き

もっとそばにいたい

ずっと一緒にいたい

君という存在

君がいてくれるから

毎日が楽しい

君がいてくれるから

幸せになれる

未来への希望

あなたと未来を

一緒に歩んでいきたい

どんな困難も乗り越えて

ずっと一緒にいよう

永遠の愛

あなたを愛してる

この気持ちは永遠に

変わらない

ずっと一緒にいよう

なお、Amazon BedrockでClaude 2を使う方法について詳しく知りたい方は、下記の記事を合わせてご確認ください。
Amazon BedrockでClaude 2のAPIを使う方法!使い方から実践まで

GPT-4超えのClaude 3を試してみる価値あり

今回は、Anthropicが公開した新しいLLM「Claude 3」の概要や使い方についてご紹介しました。ChatGPTのGPT-4やGoogleのGeminiと比較したベンチマークの結果を見ればわかる通り、Claude 3 Opus版に関しては、全ての項目においてもっともスコアが高く、優秀であることがわかります。

Xの投稿を見ても、ChatGPTやGeminiよりもClaude 3の方が人間らしいという声もあるので、多くの人から評価を得ていることがわかりますね。

また、検証した結果、個人的にはChatGPTよりもClaude 3 Opusの方がプロンプトの意図を最もよく汲み取ってくれていると感じました。日本語でもかなり精度が高いので、試してみる価値は高いでしょう。

Claudeシリーズに関しては、Webブラウザ版から簡単に利用ができます。今回ご紹介したClaude 3の利用を検討している方は課金してから後悔しないためにも、まずはClaude.AIで無料版のClaude 3 Sonnetを使って見て使用感などを試した上で、Claude 3 Opusにアップグレードしてみてはいかがでしょうか。

サービス紹介資料

生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

最後に

いかがだったでしょうか?

弊社では

・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
ハルシネーション対策AIツールの開発
自社専用のAIチャットボットの開発

などの開発実績がございます。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
無料相談

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、サービス紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • 中田

    データサイエンス専攻の大学院生。大学では、生成系AIの拡散モデルを用いた音楽生成について研究。 趣味は作曲、サッカー、コーヒー。

  • URLをコピーしました!
  • URLをコピーしました!
目次