【Claude 3.5 Haiku】Opusを速度と性能で凌駕する激安コスパ最強API!
WEELメディア事業部LLMリサーチャーの2scです。
2024年10月22日、AnthropicがClaudeシリーズ最新版の末っ子モデル「Claude 3.5 Haiku」のリリースをアナウンスしました!
こちらはなんと、先代・Claude 3 Haikuと同じ料金・同じスピード感で、アップデート前のClaude 3.5 SonnetやGPT-4oよりも優れたAIエージェントが作れるようなんです!(下図のSWE-bench Verified参照)
Anthropic公式Xの投稿はすでに1万いいねを集めており、末っ子モデルながらもClaude 3.5 Haikuが注目されている様子です。
この記事ではそんなClaude 3.5 Haikuの使い方や、有効性の検証を行います。本記事を熟読することで、Claude 3.5 Haikuの凄さを理解したうえで、サクサク動くAIエージェントが作れちゃうかもです。
ぜひ、最後までご覧ください。
Claude 3.5 Haikuの概要
「Claude 3.5 Haiku」はAnthropicが送る最新のLLM・Claude 3.5シリーズの最軽量モデル。先代・Claude 3 Haikuの後継として登場しています。
このClaude 3.5 Haikuのすごいところとしては……
- 先代の最軽量モデル・Claude 3 Haikuと同じ利用料&生成速度を実現
- 性能は先代のフラッグシップ・Claude 3 Opus並みかそれ以上
- 特にコーディング・外部ツールとの連携における性能がUP
(AIエージェントとしての性能は、アップデート前のClaude 3.5 SonnetやGPT-4oをも凌駕) - 回答の安全対策も万全
- コードの提案・チャットボット・データ抽出・コンテンツチェッカー…etc.幅広い用途に応用可
以上のとおり。特にClaude 3.5 Haikuは、AIエージェントとしての能力が優秀です。具体的には……
このように、AIエージェント用テストの「SWE-bench Verified」でアップデート前のClaude 3.5 SonnetやGPT-4oを上回るスコア40.6%を記録しています。
そんなClaude 3.5 Haikuは、2024年10月末にAPI版・Amazon Bedrock版・Vertex AI版がリリース予定。テキストのみのモデルから公開され、のちに画像入力に対応したモデルも出てくるそうです。
Claude 3.5 Haikuのライセンス・利用料金
Anthropicの規約に基づくと、Claude 3.5 Haikuは生成物&モデル自体の商用利用が可能。生成物については、著作権もユーザー側に委譲されるようです。(※2)
また、Claude 3.5 Haiku(API版)の利用料金としては……
Claude 3.5 Haiku | |
---|---|
入力 | 1Mトークンあたり0.25ドル |
キャッシュ書き込み | 1Mトークンあたり0.30ドル |
キャッシュ読み込み | 1Mトークンあたり0.03ドル |
出力 | 1Mトークンあたり1.25ドル |
以上のとおり。(※3)料金は従量課金制で使えば使うほどに発生しますが、プロンプトキャッシングで最大90%OFF、Message Batches APIで50%OFFと抑えられます。
なお、Claude 3.5 Sonnetについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
Claude 3.5 Haikuの使い方
2024年11月5日、ついにClaude 3.5 HaikuのAPI版がリリースされました。
【和訳】
Claude 3.5 Haiku は現在、Anthropic API、Amazon Bedrock、Google Cloud の Vertex AI で利用可能です。
Claude 3.5 Haiku は、これまでで最も高速かつ賢く、コスト効率の高いモデルです。その特徴をご紹介します。
ここからは、そんなClaudeの新顔の使い方を徹底解説。まずは、APIキーの発行手順から詳しくみていきましょう!
APIキーの発行手順
Claude 3.5 Haiku用のAPIキーは簡単に発行ができます。詳しくみていきましょう!まず、Anthropic Consoleの「Get API keys」にアクセスしてみてください!すると……
このような画面が表示されるはずですので、上図青枠「+Create Key」をクリックします。
続いて、ポップアップ表示されるテキストボックスに……
それぞれ、APIキーの名前と連携先を記入しましょう。
最後は、「Add」をクリックします。すると……
このようにAPIキーが表示されますので、青枠「Copy Key」をクリックしてクリップボードにコピーしてください。このAPIキーは後から確認ができませんので、適宜メモ帳にもペーストしておきましょう。
回答生成の手順
API版Claude 3.5 Haikuを使うには、Python 3.8以上の実行環境とライブラリ「Anthropic」が必要です。手始めに、下記のコードを実行して、PythonライブラリのAnthropicをインストールしてしまいましょう!
pip install anthropic
次に、Claude 3.5 Haikuを動かすためのコードは下記のとおり。通常のプロンプトによる命令のほか、システムプロンプトによる役割の指定なども可能です。(※3)
import anthropic
client = anthropic.Anthropic(
api_key="取得したAPIキー",
)
message = client.messages.create(
model="モデル名",
max_tokens=100, #出力トークン数、上限まで指定可
temperature=1, #回答の自由度、0.0~1が指定可
system="システムプロンプト",#大まかな役割・振る舞いを任意で指定可
messages=[
{
"role": "user",
"content": "プロンプト"
}
]
}
]
)
print(message.content[0].text)
ということで早速、上記のコードにプロンプト・Tempereture・Max tolens・システムプロンプトを書き加えて、実行してみます。今回実行するのは……
import anthropic
client = anthropic.Anthropic(api_key="任意のAPIキー")
prompt="""取引先に対して、アポイントメントのメールを作成してください。"""
message = client.messages.create(model="claude-3-5-haiku-20241022",max_tokens=8192, temperature=0.2, system="You are a helpful assistant.",messages=[{"role": "user","content": prompt}])
print(message.content[0].text)
以上のコード。それでは、Claude 3.5 Haikuを動かしてみましょう!
するとこのように、Claude 3.5 Haikuはメールのひな形を返してくれました。大まかな敬語の使い方はもちろんのこと、宛名と自分の名前の位置関係まで守ってくれています。これは確かに、先代Opus超えもあり得そうですね!
Claude 3.5 Haikuとライバルを検証・比較してみた!
さて、ここからはみなさんお待ちかね、実験パートです。Claude 3.5 HaikuとライバルのLLMをGoogle Colaboratory上で実際に使ってみて、回答生成の速度や品質を比較していきます。
今回、実際に性能比較で用いるLLMは……
【速度を比較】
- Claude 3.5 Haiku
- Claude 3 Opus
- GPT-4o
- Claude 3 Haiku
- Claude 3.5 Sonnet
【品質を比較】
- Claude 3.5 Haiku
- Claude 3 Opus
- GPT-4o
以上のとおり。回答の品質については、実力が拮抗しているであろう3モデルに絞ります。
続いて、実験に使用するPythonコードは次のとおりです。回答生成と回答時間の測定をモデル別で関数にまとめています。
import anthropic
from openai import OpenAI
import time
import os
os.environ["OPENAI_API_KEY"] = "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"
client1 = anthropic.Anthropic(api_key="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")
client2 = OpenAI()
def gpt(prompt):
print("GPT-4o miniの回答")
start=time.time()
response = client2.chat.completions.create(model = "gpt-4o-mini",messages = [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": prompt}],temperature=0.2)
text = response.choices[0]
print(text)
end=time.time()
print("経過時間は……")
print(end-start)
def haiku(prompt):
print("Claude 3.5 Haikuの回答")
start=time.time()
message = client1.messages.create(model="claude-3-5-haiku-20241022",max_tokens=8192, temperature=0.2, system="You are a helpful assistant.",messages=[{"role": "user","content": prompt}])
print(message.content[0].text)
end=time.time()
print("経過時間は……")
print(end-start)
def oldhaiku(prompt):
print("Claude 3 Haikuの回答")
start=time.time()
message = client1.messages.create(model="claude-3-haiku-20240307",max_tokens=4096, temperature=0.2, system="You are a helpful assistant.",messages=[{"role": "user","content": prompt}])
print(message.content[0].text)
end=time.time()
print("経過時間は……")
print(end-start)
def opus(prompt):
print("Claude 3 Opusの回答")
start=time.time()
message = client1.messages.create(model="claude-3-opus-20240229",max_tokens=4096, temperature=0.2, system="You are a helpful assistant.",messages=[{"role": "user","content": prompt}])
print(message.content[0].text)
end=time.time()
print("経過時間は……")
print(end-start)
def sonnet(prompt):
print("Claude 3.5 Sonnetの回答")
start=time.time()
message = client1.messages.create(model="claude-3-5-sonnet-20241022",max_tokens=8192, temperature=0.2, system="You are a helpful assistant.",messages=[{"role": "user","content": prompt}])
print(message.content[0].text)
end=time.time()
print("経過時間は……")
print(end-start)
最後に、プロンプトの入力と結果の表示には下記のコードを使用。モデル別での結果を一度に表示させています。
meirei="""プロンプト"""
haiku(meirei)
oldhaiku(meirei)
opus(meirei)
sonnet(meirei)
gpt(meirei)
それでは以下、和訳のタスクから実験を行なっていきましょう!
長文の和訳
まずは、Claude 3.5 Haikuとその他LLM4種に下記のプロンプトを入力して、長文での翻訳能力を検証・比較していきます。
プロンプトはこちら
あなたは優秀な翻訳家です。
以下の英語文章を、一語一句日本語に翻訳してください。
翻訳を省略したり要約した場合、ペナルティを課します。
Announcements
New
Claude 3.5 Haiku and a new Claude 3.5 Sonnet
Claude 3.5 Haiku is the next generation of our fastest model. For a similar speed to Claude 3 Haiku, Claude 3.5 Haiku improves across every skill set and surpasses Claude 3 Opus, the largest model in our previous generation, on many intelligence benchmarks.
Read more
Availability and pricing
Claude 3.5 Haiku is available across our first-party API, Amazon Bedrock, and Google Cloud’s Vertex AI—initially as a text-only model and with image input to follow.
Pricing for Claude 3.5 Haiku starts at $1 per million input tokens and $5 per million output tokens, with up to 90% cost savings with prompt caching and 50% cost savings with the Message Batches API. To learn more, check out our pricing page.
Use cases
With fast speeds, improved instruction following, and more accurate tool use, Claude 3.5 Haiku is well suited for user-facing products, specialized sub-agent tasks, and generating personalized experiences from huge volumes of data. Popular use cases include:
Code completions
Claude 3.5 Haiku offers quick, accurate code suggestions and completions to accelerate development workflows. It’s ideal for software teams looking to streamline their coding process and boost productivity.
Interactive chatbots
With enhanced conversational abilities and rapid response times, Claude 3.5 Haiku excels at powering responsive chatbots that can handle high volumes of user interactions. It’s particularly valuable for customer service, e-commerce, and educational platforms requiring scalable engagement.
Data extraction and labeling
Claude 3.5 Haiku efficiently processes and categorizes information, making it effective for rapid data extraction and automated labeling tasks. This capability is especially useful for organizations dealing with large volumes of unstructured data across finance, healthcare, and research.
Real-time content moderation
Claude 3.5 Haiku provides reliable, immediate content moderation through its improved reasoning and content understanding capabilities. This makes it valuable for social platforms, online communities, and media organizations that need to maintain safe, appropriate content at scale.
Benchmarks
Claude 3.5 Haiku offers strong performance and speed across a variety of coding, tool use, and reasoning tasks.
3.5 Haiku Benchmarks
Trust & Safety
Anthropic’s commitment to safety shapes every step of our AI development. During Claude 3.5 Haiku’s development, we conducted extensive safety evaluations spanning multiple languages and policy domains. We also enhanced Claude’s ability to navigate sensitive content with appropriate care. Our internal testing confirms that Claude 3.5 Haiku delivers substantial advances in capabilities while upholding our rigorous safety standards.
こちらを各モデルに渡してみたところ、回答生成の速さ(生成完了までの秒数)は下記のとおりになりました。Anthropicの発表とは裏腹に、先代のHaikuがClaude 3.5 Haikuの速さを上回っていますね。
【生成の速さランキング】
- Claude 3 Haiku:8.989551782608032秒
- GPT-4o mini:10.933892488479614秒
- Claude 3.5 Haiku:17.500645875930786秒
- Claude 3.5 Sonnet:18.011675596237183秒
- Claude 3 Opus:41.18119263648987秒
続いて、回答の品質は……
Claude 3.5 Haiku | Claude 3 Opus | GPT-4o mini | |
---|---|---|---|
回答 | 以下に、原文の逐語的な日本語訳を提供します: お知らせ 新着 Claude 3.5 Haiku と新しい Claude 3.5 Sonnet Claude 3.5 Haiku は、私たちの最速モデルの次世代版です。Claude 3 Haiku と同様の速度で、Claude 3.5 Haiku はすべてのスキルセットで改善され、前世代の最大モデルである Claude 3 Opusを多くの知能ベンチマークで上回っています。 詳細を読む 利用可能性と価格設定 Claude 3.5 Haiku は、最初はテキストのみのモデルとして、その後画像入力と共に、当社の第一者API、Amazon Bedrock、Google Cloud の Vertex AI で利用可能です。 Claude 3.5 Haiku の価格設定は、入力トークン100万あたり1ドル、出力トークン100万あたり5ドルから始まり、プロンプトキャッシングで最大90%のコスト削減、メッセージバッチAPIで50%のコスト削減が可能です。詳細については、価格設定ページをご確認ください。 ユースケース 高速な処理、改善された指示従属性、より正確なツール使用により、Claude 3.5 Haiku はユーザー向け製品、特殊なサブエージェントタスク、大量のデータからパーソナライズされた体験を生成するのに適しています。人気のユースケースは以下の通りです: コード補完 Claude 3.5 Haiku は、開発ワークフローを加速するための迅速で正確なコード提案と補完を提供します。コーディングプロセスを合理化し、生産性を向上させたいソフトウェアチームに最適です。 インタラクティブチャットボット 強化された会話能力と迅速な応答時間により、Claude 3.5 Haiku は大量のユーザー対話を処理できる応答性の高いチャットボットを強力にサポートします。特に、顧客サービス、Eコマース、スケーラブルな対話を必要とする教育プラットフォームに価値があります。 データ抽出とラベル付け Claude 3.5 Haiku は情報を効率的に処理し分類するため、迅速なデータ抽出と自動ラベル付けタスクに効果的です。この機能は、金融、医療、研究分野で大量の非構造化データを扱う組織に特に有用です。 リアルタイムコンテンツモデレーション Claude 3.5 Haiku は、改善された推論とコンテンツ理解能力を通じて、信頼性が高く即時のコンテンツモデレーションを提供します。これにより、ソーシャルプラットフォーム、オンラインコミュニティ、安全で適切なコンテンツを大規模に維持する必要があるメディア組織にとって価値があります。 ベンチマーク Claude 3.5 Haiku は、様々なコーディング、ツール使用、推論タスクで強力な性能と速度を提供します。 3.5 Haiku ベンチマーク トラストと安全性 Anthropicの安全性へのコミットメントは、AIの開発のあらゆる段階を形作っています。Claude 3.5 Haikuの開発中、複数の言語とポリシー領域にわたる広範な安全性評価を実施しました。また、Claudeの機密性の高いコンテンツを適切に注意深く扱う能力を強化しました。社内テストにより、Claude 3.5 Haikuが厳格な安全基準を維持しながら、機能面で大幅な進歩を遂げていることを確認しています。 | お知らせ 新着 Claude 3.5 Haiku と新しい Claude 3.5 Sonnet Claude 3.5 Haiku は、私たちの最速モデルの次世代版です。Claude 3 Haiku と同様の速度で、Claude 3.5 Haiku はあらゆるスキルセットで改善され、多くの知能ベンチマークにおいて前世代の最大モデルである Claude 3 Opus を上回ります。 詳細を読む 利用可能性と価格設定 Claude 3.5 Haiku は、当社の独自 API、Amazon Bedrock、Google Cloud の Vertex AI で利用可能です。当初はテキストのみのモデルとして提供され、画像入力への対応が予定されています。 Claude 3.5 Haiku の価格は、入力トークン 100 万個あたり 1 ドル、出力トークン 100 万個あたり 5 ドルから始まり、プロンプトのキャッシュにより最大 90%、Message Batches API により 50% のコスト削減が可能です。詳細については、価格ページをご確認ください。 ユースケース 高速性、指示に従う能力の向上、より正確なツールの使用により、Claude 3.5 Haiku はユーザー向け製品、特殊なサブエージェントタスク、膨大なデータからのパーソナライズされた体験の生成に適しています。一般的なユースケースには以下のようなものがあります。 コード補完 Claude 3.5 Haiku は、迅速かつ正確なコード提案と補完を提供し、開発ワークフローを加速します。コーディングプロセスを合理化し、生産性を向上させたいソフトウェアチームに最適です。 インタラクティブなチャットボット 会話能力の向上と高速な応答時間により、Claude 3.5 Haiku は大量のユーザーインタラクションを処理できる応答性の高いチャットボットの動力源として優れています。特にスケーラブルなエンゲージメントを必要とするカスタマーサービス、eコマース、教育プラットフォームに特に有用です。 データ抽出とラベリング Claude 3.5 Haiku は情報を効率的に処理し分類するため、迅速なデータ抽出と自動ラベリングタスクに効果的です。この機能は、金融、ヘルスケア、研究など、大量の非構造化データを扱う組織に特に役立ちます。 リアルタイムのコンテンツモデレーション Claude 3.5 Haiku は、推論能力とコンテンツ理解能力の向上により、信頼性の高い即時のコンテンツモデレーションを提供します。これにより、安全で適切なコンテンツを大規模に維持する必要のあるソーシャルプラットフォーム、オンラインコミュニティ、メディア組織にとって価値があります。 ベンチマーク Claude 3.5 Haiku は、さまざまなコーディング、ツールの使用、推論タスクにおいて優れたパフォーマンスと速度を提供します。 3.5 Haiku ベンチマーク 信頼と安全性 Anthropic の安全性へのコミットメントは、AI 開発のあらゆるステップを形作っています。Claude 3.5 Haiku の開発中、私たちは複数の言語とポリシードメインにまたがる広範な安全性評価を実施しました。また、デリケートなコンテンツを適切な注意を払って扱う Claude の能力も強化しました。社内テストにより、Claude 3.5 Haiku が厳格な安全基準を維持しながら、大幅な能力の向上を実現していることが確認されています | お知らせ 新しい Claude 3.5 Haiku と新しい Claude 3.5 Sonnet Claude 3.5 Haiku は、私たちの最も速いモデルの次世代です。Claude 3 Haiku と同様の速度で、Claude 3.5 Haiku はすべてのスキルセットで改善され、前の世代の最大モデルである Claude 3 Opus を多くの知能ベンチマークで上回ります。 もっと読む 利用可能性と価格 Claude 3.5 Haiku は、私たちのファーストパーティ API、Amazon Bedrock、Google Cloud の Vertex AI で利用可能です—最初はテキストのみのモデルとして、画像入力は後に続きます。 Claude 3.5 Haiku の価格は、100万入力トークンあたり1ドル、100万出力トークンあたり5ドルから始まり、プロンプトキャッシングで最大90%のコスト削減、Message Batches API で50%のコスト削減が可能です。詳細については、私たちの価格ページをご覧ください。 使用例 高速な速度、改善された指示の遵守、より正確なツールの使用により、Claude 3.5 Haiku はユーザー向け製品、専門的なサブエージェントタスク、膨大なデータからのパーソナライズされた体験の生成に適しています。人気の使用例には以下が含まれます: コード補完 Claude 3.5 Haiku は、開発ワークフローを加速するために迅速で正確なコード提案と補完を提供します。これは、コーディングプロセスを効率化し、生産性を向上させたいソフトウェアチームに最適です。 インタラクティブチャットボット 会話能力が向上し、応答時間が迅速な Claude 3.5 Haiku は、高いユーザーインタラクションのボリュームを処理できる応答性の高いチャットボットを動かすのに優れています。これは、スケーラブルなエンゲージメントを必要とするカスタマーサービス、eコマース、教育プラットフォームに特に価値があります。 データ抽出とラベリング Claude 3.5 Haiku は情報を効率的に処理し、分類するため、迅速なデータ抽出と自動ラベリングタスクに効果的です。この機能は、金融、ヘルスケア、研究などの分野で大量の非構造化データを扱う組織に特に役立ちます。 リアルタイムコンテンツモデレーション Claude 3.5 Haiku は、その改善された推論とコンテンツ理解能力を通じて、信頼性の高い即時のコンテンツモデレーションを提供します。これにより、安全で適切なコンテンツを大規模に維持する必要があるソーシャルプラットフォーム、オンラインコミュニティ、メディア組織にとって価値があります。 ベンチマーク Claude 3.5 Haiku は、さまざまなコーディング、ツール使用、推論タスクにおいて強力なパフォーマンスと速度を提供します。 3.5 Haiku ベンチマーク 信頼と安全 Anthropic の安全へのコミットメントは、私たちの AI 開発のすべてのステップを形作っています。Claude 3.5 Haiku の開発中に、私たちは複数の言語とポリシー領域にわたる広範な安全評価を実施しました。また、Claude が敏感なコンテンツを適切に扱う能力を向上させました。私たちの内部テストは、Claude 3.5 Haiku が能力において大幅な進展を提供しながら、私たちの厳格な安全基準を維持していることを確認しています。 |
以上のとおり。一見するとどれも同じですが、和訳した文章の自然さ・読みやすさでいえば、先代のフラッグシップモデルであるClaude 3 Opusが抜きん出ている感じですね。
日本語のビジネスメール
続いては、ビジネスメールの生成能力についても、比較していきましょう。今回は下記のプロンプトを、Claude 3.5 Haikuとその他LLM4種に入力します。
プロンプトはこちら
あなたは、優秀なビジネスマンです。以下の内容をもとに、メールの返信内容を出力してください。
#受信したメール内容
○○様
お世話になっております。
お忙しいところ失礼いたします。
現在進行中の施策について情報共有したいことがあり、ミーティングをお願いできればと思っております。
ご都合の良い日時をお知らせいただけますと幸いです。
以下の時間帯で、ご都合が合う時間がございましたらご教示ください。
8/6(火): 10:00~18:00
8/7(水): 10:00~18:00
お忙しいところ恐縮ですが、何卒よろしくお願いいたします
合わせて、ミーティングの際に使用させていただく資料も共有させていただきます。
お手すきの際にご確認いただけると幸いです。
#返信に含める内容
– 8月7日(水)17:00~18:00の日程が参加可能
– 試料がまとまっていてキレイであることを褒める
#条件
– 敬語を正確に使う
– 文章最後に電子署名を入れる
#出力
本文:
それでは結果をみていきましょう!まず、気になる回答生成の速度は……
【生成の速さランキング】
- Claude 3 Haiku:2.293555736541748秒
- GPT-4o mini:2.926245927810669秒
- Claude 3.5 Haiku:5.266385316848755秒
- Claude 3.5 Sonnet:6.091147184371948秒
- Claude 3 Opus:14.52900218963623秒
以上のとおり。先ほどと全く同じ順位で、先代Haikuの圧勝です。
次に、生成されたメール文章は……
Claude 3.5 Haiku | Claude 3 Opus | GPT-4o mini | |
---|---|---|---|
回答 | 本文: WEEL様 拝啓 時下ますますご清祥のこととお慶び申し上げます。 先日は、ご連絡をいただき、誠にありがとうございます。 ご提案いただいたミーティングにつきまして、11月6日(水)17:00~18:00で参加が可能でございます。お時間のご調整、誠にありがとうございます。 また、共有いただいた資料は非常に丁寧にまとめられており、非常に分かりやすく整理されております。資料作成にあたってのご尽力に敬意を表します。 ミーティングに向けて、さらに準備を進めてまいります。 何卒よろしくお願い申し上げます。 敬具 株式会社○○○○ 営業部 部長 山田 太郎 Mail: yamada.taro@○○○○.co.jp TEL: 03-XXXX-XXXX | WEEL様 お世話になっております。 ミーティングのご提案ありがとうございます。 ご提示いただいた日程の中で、11月6日(水)17:00~18:00でしたら参加可能です。 ご都合が合えば、その時間でミーティングを設定いただけますと幸いです。 また、ミーティング資料のご共有もありがとうございました。 資料を拝見いたしましたが、非常にまとまりがよく見やすい内容になっていると感じました。 当日はこちらの資料を使用しながら、有意義な議論ができることを楽しみにしております。 ご多忙の中、このようなご提案や資料作成をしていただき感謝いたします。 引き続きどうぞよろしくお願いいたします。 株式会社〇〇 ××部 △△△△ TEL: 03-XXXX-XXXX Email: xxxx@xxxxxx.co.jp | 件名: Re: ミーティングのお願い WEEL様 お世話になっております。ご連絡いただき、ありがとうございます。 現在進行中の施策についての情報共有、ぜひお伺いしたく思っております。ご提案いただきました日程の中では、11月6日(水)17:00~18:00が参加可能です。この時間帯でお約束できれば幸いです。 また、ミーティングの際に使用される資料についても拝見させていただきました。非常にまとまっており、見やすく整理されている点に感心いたしました。 お忙しいところ恐縮ですが、何卒よろしくお願い申し上げます。 敬具 [あなたの名前] [あなたの役職] [あなたの会社名] [あなたの電話番号] [あなたのメールアドレス] |
このようになっていて、どれも同程度の品質。ただ、雰囲気が違っていてClaude 3.5 Haikuは硬めの文体、Claude 3 Opus & GPT-4o miniは柔らかめの文体となっています。
言葉の変換
今度は、Cluade 3.5 Haikuとその他LLM4種に、下記の不適切な言葉を丁寧な言葉に変換してもらいます。
プロンプトはこちら
あなたは、優秀なビジネスマンです。以下の内容をもとに、欠勤メールの文章をリライトしてください。
#メール内容
よう!くそパイセン!
昨日の飲み会のせいで2日酔い酷くて朝から死ぬほど頭痛いんで、会社休むわー
今日の俺の業務も代わりにやっといてー
あ、あと明日は会社行けたら行く
よろー
#条件
– 敬語を正確に使う
– 不適切な内容は排除してください。
– 悪い言葉をすべて丁寧な言葉に変える
– 文章最後に電子署名を入れる
#出力
本文:
それではまず、生成速度からみていきましょう!
【生成の速さランキング】
- Claude 3 Haiku:1.2682750225067139秒
- GPT-4o mini:1.8579983711242676秒
- Claude 3.5 Haiku:3.5409796237945557秒
- Claude 3.5 Sonnet:4.974727153778076秒
- Claude 3 Opus:10.837232828140259秒
なるほど……これまで通りの順位で、先代Haikuの圧勝となりました。
次に、返ってきた回答は……
Claude 3.5 Haiku | Claude 3 Opus | GPT-4o mini | |
---|---|---|---|
回答 | 本文: ○○様 拝啓 大変申し訳ございませんが、体調不良のため本日は欠勤させていただきます。 昨日の懇親会の影響で、現在、体調が優れておりません。つきましては、本日の業務を同僚の皆様にお願いすることとなり、大変恐縮です。 可能であれば、明日には出勤できるよう、現在療養に努めております。 何卒ご理解とご協力のほど、よろしくお願い申し上げます。 敬具 ○○○○ 人事部 株式会社○○○○ | 本文: 佐藤部長 お世話になっております。田中太郎です。 昨夜の懇親会の後、体調を崩してしまい、本日は出社が難しい状況です。 大変申し訳ございませんが、本日1日休暇を頂戴したく存じます。 私の本日の業務に関しましては、ご多忙のところ大変恐縮ではございますが、可能な範囲でご対応いただけますと幸いです。 なお、明日は体調が回復次第、出社させていただく所存です。 ご理解とご配慮を賜りますよう、何卒よろしくお願い申し上げます。 株式会社〇〇〇〇 営業部 田中太郎 メールアドレス: taro.tanaka@xxxx.co.jp 電話番号: 090-1234-5678 | 件名: 欠勤のご連絡 お疲れ様です。 昨日の飲み会の影響で、二日酔いがひどく、今朝から強い頭痛に悩まされております。そのため、本日は会社をお休みさせていただきたく、ご連絡いたしました。 本日私が担当する業務については、代わりにお願いできれば幸いです。明日については、体調が回復次第、出社できるよう努めます。 ご迷惑をおかけしますが、何卒よろしくお願いいたします。 敬具 [あなたの名前] [あなたの部署] [あなたの連絡先] [会社名] |
以上のとおり。今回は3モデルの中で唯一、体調不良の内容(二日酔いからの頭痛)を含めてくれたGPT-4oの勝利とします。
問い合わせ対応
続いて、下記のプロンプトを使って、Claude 3.5 Haikuとその他LLM4種の問い合わせ対応能力をみていきます。
プロンプトはこちら
あなたは、優秀なカスタマーサポートのオペレーターです。以下の内容をもとに、メールの返信内容を出力してください。
#受信したメール内容
最近使用しているチャットボットに関して問題が発生し、メールさせていただきました。
具体的には、メッセージを送信してもチャットボットが反応しないことが多々あります。例えば、メッセージを送信しても、何の返答もない状態が続いています。
この状況が続くと、非常に不便であり、業務にも支障が出てしまいます。
この問題の原因を調査していただき、早急に対策を講じていただけないでしょうか。
お手数をおかけしますが、どうぞよろしくお願いいたします。
#返信に含める内容
– 謝罪
– 対処法
#条件
– 敬語を正確に使う
– 具体的な解決策や対応方法を明記する
#出力文
本文:
まずは恒例、回答生成の速度からご覧ください!
【生成の速さランキング】
- Claude 3 Haiku:2.6138439178466797秒
- GPT-4o mini:3.8349974155426025秒
- Claude 3.5 Haiku:5.98279595375061秒
- Claude 3.5 Sonnet:9.107584714889526秒
- Claude 3 Opus:17.469351768493652秒
またしても同順。特にコメントできることはありませんね……
次に、返ってきた回答についても、みていきましょう。
Claude 3.5 Haiku | Claude 3 Opus | GPT-4o mini | |
---|---|---|---|
回答 | 本文: 拝啓 お客様 この度は、チャットボットの不具合によりご迷惑とご不便をおかけし、心より深くお詫び申し上げます。 お客様からご報告いただいた問題につきまして、早速調査を開始いたしました。現在、以下の対応を予定しております: 1. システム診断:チャットボットの応答性能を徹底的に検証いたします。 2. 技術チームによる原因特定:メッセージ未応答の具体的な原因を特定いたします。 3. 緊急修復作業:判明した問題点に対し、即時の修正作業を実施いたします。 お客様への対応として、暫定的に以下の方法をお勧めいたします: – 再度チャットボットにメッセージを送信する – ブラウザを更新する – 別のブラウザやデバイスでお試しいただく 詳細な調査結果および解決策につきましては、3営業日以内にご連絡させていただきます。 お客様にはご迷惑をおかけして誠に申し訳ございません。何卒ご理解とご協力を賜りますようお願い申し上げます。 敬具 カスタマーサポート チーム | 様 平素は弊社のチャットボットをご利用いただき、誠にありがとうございます。 この度は、チャットボットの不具合により、ご不便をおかけしておりますこと、心よりお詫び申し上げます。 お客様からいただきましたご報告を踏まえ、弊社にて早速原因の調査を行いました。その結果、チャットボットのシステムに一時的な障害が発生していたことが判明いたしました。現在は、システムの復旧作業を完了し、チャットボットは正常に稼働しております。 つきましては、お手数ではございますが、再度チャットボットをお試しいただけますと幸いです。もし、引き続き同様の問題が発生する場合は、お手数ですが、以下の情報を添えて、再度ご連絡いただけますでしょうか。 1. 問題が発生した日時 2. 送信したメッセージの内容 3. エラーメッセージ(表示された場合) これらの情報を基に、さらに詳細な調査を行い、問題の解決に努めてまいります。 今後とも、安定したサービスの提供ができるよう、システムの監視と改善に努めてまいりますので、引き続きご愛顧を賜りますよう、よろしくお願い申し上げます。 ご不便をおかけしましたことを重ねてお詫び申し上げます。 敬具 株式会社○○○○ カスタマーサポート担当 ×××× | 件名: チャットボットの不具合についてのお詫びと対策のご案内 [お客様名] 様 平素よりお世話になっております。カスタマーサポートの[あなたの名前]です。 この度は、チャットボットに関する問題でご不便をおかけし、誠に申し訳ございません。お客様の業務に支障をきたしているとのことで、心よりお詫び申し上げます。 ご指摘いただきました、メッセージ送信後にチャットボットが反応しない件について、以下の対策を講じさせていただきます。 1. **システムの再起動**: 一時的な不具合が考えられますので、システムを再起動し、正常に動作するか確認いたします。 2. **ログの確認**: チャットボットのログを確認し、エラーや異常が発生していないか調査いたします。 3. **設定の見直し**: チャットボットの設定に問題がないか再確認し、必要に応じて調整を行います。 これらの対策を早急に実施し、進捗状況については改めてご報告させていただきます。また、問題が解決しない場合は、別の方法でのサポートも検討いたしますので、お気軽にご連絡ください。 お手数をおかけいたしますが、何卒よろしくお願い申し上げます。 敬具 [あなたの名前] カスタマーサポート [会社名] [連絡先] |
今回もGPT-4o miniが特に優秀な感じ。全体的に具体性の高い解決策を返してくれています。次点で、Claude 3.5 Haikuも優秀でした。
ただ、Claude 3 Opusは解決策の代わりに、トラブルが解決した体の文章を勝手に生成してしまっています。
SNSの投稿文
最後に、Claude 3.5 Haikuとその他LLM4種の案出し能力を比較していきます。今回は下記プロンプトを使って、SNSの投稿文を考えさせてみましょう!
プロンプトはこちら
# 指示内容
## Prerequisites
**タイトル** 共感を呼ぶツイートで新たなフォロワーを獲得するためのAIプロンプト
**依頼者条件** SNSで共感を呼ぶ魅力的なコンテンツを発信したい個人や企業。心に響くメッセージや情報を提供し、フォロワーとのつながりを深める意欲があること。
**制作者条件** 感情に訴える表現力に秀でた制作者。洗練された文章を作成する能力を持ち、ターゲットオーディエンスの共感を引き出すクリエイティブなプロンプトを作成することができること。
**目的と目標** 共感を呼ぶツイートを通じて、読者の心に響くメッセージを伝えるプロンプトを生成すること。感動や共感を引き起こし、新たなフォロワーを獲得することを目指す。
## End Prerequisites
@投稿者:”
生成AIエンジニア
“
@ターゲット:”
生成AIをビジネスに活かしたいと考えているビジネスマン
“
@文体や語調:”
ですます
“
step1:
${投稿者}が${ターゲット}にクリエイティブな情報や提案を提供するためにテーマを5個出してください。
step2:
step1で出したテーマにそれぞれ100点満点で点数をつけてください。
step3:
setp2で一番点数の高かったテーマを選んでください。
step4:
setp3で一番点数の高かったテーマから${ターゲット}にとって魅力的なトピックを5個出してください。
step5:
step4で出したトピックにそれぞれ100点満点で点数をつけてください。
step6:
setp5で一番点数の高かったトピックを選んでください。
## 出力行動
setp6で選定したトピックで、${ターゲット}向けに、${文体や語調}の文章で140文字で作成してください。
### 禁則文字
– 絵文字
– 特殊文字
### 注意事項
– 指示のみ従って文章を作成してください。
– 余計な説明や注意喚起は不要です。
ということでまずは、回答生成の速度からどうぞ!
【生成の速さランキング】
- Claude 3 Haiku:4.383708477020264秒
- GPT-4o mini:5.839798450469971秒
- Claude 3.5 Haiku:8.998962640762329秒
- Claude 3.5 Sonnet:9.218515872955322秒
- Claude 3 Opus:22.590426683425903秒
以上のとおり、回答生成の速度はこれまでと全く同じでした。
次に、返ってきたアイデア&投稿文は……
Claude 3.5 Haiku | Claude 3 Opus | GPT-4o mini | |
---|---|---|---|
回答 | ## Step 1: テーマ5個 1. 生成AIの最新ビジネス活用事例 2. AIツールによる生産性向上戦略 3. 中小企業向けAI導入のコスト効果 4. AIが変革するマーケティングアプローチ 5. 生成AIと人間の協働モデル ## Step 2: テーマ点数 1. 生成AIの最新ビジネス活用事例 – 95点 2. AIツールによる生産性向上戦略 – 90点 3. 中小企業向けAI導入のコスト効果 – 85点 4. AIが変革するマーケティングアプローチ – 80点 5. 生成AIと人間の協働モデル – 75点 ## Step 3: 最高点テーマ 生成AIの最新ビジネス活用事例 ## Step 4: トピック5個 1. 製造業におけるAI品質管理 2. 金融分野のリスク分析 3. カスタマーサポートのAI自動化 4. 医療診断支援システム 5. 人事採用プロセスの効率化 ## Step 5: トピック点数 1. 製造業におけるAI品質管理 – 95点 2. 金融分野のリスク分析 – 90点 3. カスタマーサポートのAI自動化 – 85点 4. 医療診断支援システム – 80点 5. 人事採用プロセスの効率化 – 75点 ## Step 6: 最高点トピック 製造業におけるAI品質管理 ## 出力 AIが製造業の品質管理を革新。画像認識技術で不良品を瞬時に検出し、生産効率と品質を劇的に向上させる最新ソリューションをご紹介します。 | step1: 1. 生成AIを活用した新しいビジネスモデルの提案 2. 生成AIを導入することによる業務効率化のアイデア 3. 生成AIを用いたコンテンツ制作の事例紹介 4. 生成AIの倫理的な活用方法についての考察 5. 生成AIの未来と企業が取るべき戦略 step2: 1. 生成AIを活用した新しいビジネスモデルの提案: 85点 2. 生成AIを導入することによる業務効率化のアイデア: 80点 3. 生成AIを用いたコンテンツ制作の事例紹介: 90点 4. 生成AIの倫理的な活用方法についての考察: 75点 5. 生成AIの未来と企業が取るべき戦略: 70点 step3: 生成AIを用いたコンテンツ制作の事例紹介 step4: 1. 生成AIを活用した広告コピーの作成事例 2. 生成AIによるSNS投稿の自動生成事例 3. 生成AIを用いたWebサイトのコンテンツ最適化事例 4. 生成AIによるプレスリリースの作成事例 5. 生成AIを活用したブログ記事の自動生成事例 step5: 1. 生成AIを活用した広告コピーの作成事例: 85点 2. 生成AIによるSNS投稿の自動生成事例: 90点 3. 生成AIを用いたWebサイトのコンテンツ最適化事例: 80点 4. 生成AIによるプレスリリースの作成事例: 75点 5. 生成AIを活用したブログ記事の自動生成事例: 70点 step6: 生成AIによるSNS投稿の自動生成事例 生成AIでSNS投稿を自動化。投稿頻度が上がり、フォロワーとのエンゲージメントが向上。コンテンツの質も維持できる画期的な事例です。ぜひ参考にしてみてください。 | step1: 1. 生成AIを活用した業務効率化の成功事例 2. 生成AIによるマーケティング戦略の革新 3. 生成AIを使った顧客体験の向上 4. 生成AIの導入における課題と解決策 5. 生成AIの未来とビジネスへの影響 step2: 1. 生成AIを活用した業務効率化の成功事例 – 90点 2. 生成AIによるマーケティング戦略の革新 – 85点 3. 生成AIを使った顧客体験の向上 – 80点 4. 生成AIの導入における課題と解決策 – 75点 5. 生成AIの未来とビジネスへの影響 – 70点 step3: 一番点数の高かったテーマは「生成AIを活用した業務効率化の成功事例」です。 step4: 1. 具体的な業務効率化の成功事例の紹介 2. 生成AIを導入した企業のインタビュー 3. 業務効率化における生成AIの効果測定 4. 生成AIを活用したプロセス改善のステップ 5. 生成AI導入後の社員の反応と変化 step5: 1. 具体的な業務効率化の成功事例の紹介 – 95点 2. 生成AIを導入した企業のインタビュー – 85点 3. 業務効率化における生成AIの効果測定 – 80点 4. 生成AIを活用したプロセス改善のステップ – 75点 5. 生成AI導入後の社員の反応と変化 – 70点 step6: 一番点数の高かったトピックは「具体的な業務効率化の成功事例の紹介」です。 生成AIを活用した業務効率化の成功事例を知ることで、あなたのビジネスにも新たな可能性が広がります。具体的な事例を参考にしてみませんか。 |
このように三者三様。生成AIではなく画像認識AIについて触れているClaude 3.5 Haikuは論外として、Claude 3 OpusとGPT-4o miniはいい感じの投稿文を考えてくれました。ただ、今回のところは、具体的なメリットも込みで投稿文を生成してくれたClaude 3 Opusの勝利としましょう!
最後の最後に、ここまでの実験結果を総括していきます。まず、回答生成の速度はどの実験でも変わらず以下のとおり。Anthropicの発表内容に反して、終始Claude 3 HaikuがClaude 3.5 Haikuのスピードを上回っていました。
- Claude 3 Haiku
- GPT-4o mini
- Claude 3.5 Haiku
- Claude 3.5 Sonnet
- Claude 3 Opus
続いて、Claude 3.5 Haiku・Claude 3 Opus・GPT-4o miniの回答品質の比較結果もまとめます。こちらは優れている順に……
- GPT-4o mini
- Claude 3.5 Haiku
- Claude 3 Opus
以上のとおり。今回、Claude 3.5 Haikuは安定してClaude 3 Opus以上のコンテンツを生成してくれています。
速さ&安さはそのまま品質UPの「Claude 3.5 Haiku」
当記事では、利用料金と生成速度は据え置きで回答の質が大幅UPしたHaikuの最新版「Claude 3.5 Haiku」をご紹介しました。
冒頭で取り上げたAnthropic公式Xの投稿が1万いいねを集めていたように、Claude 3.5 Haikuは末っ子モデルながらに注目を集めています。かくいうリサーチャーも興味津々で、Claude 3.5 Haikuなら質の高いAIツールが作れるんじゃないかと思っています。今後の活躍に期待が持てそうですね!
最後に
いかがだったでしょうか?
低コストながらClaude 3 Opusよりも高性能なClaude 3.5 Haikuを使えば、今までよりもコストパフォーマンス格段に上げられるでしょう。
株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!
開発実績として、
・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、大規模言語モデル(LLM)を対象に、言語理解能力、生成能力、応答速度の各側面について比較・検証した資料も配布しております。この機会にぜひご活用ください。