ChatGPTの代替になるオープンソースツール5選!メリットも解説
WEELメディア事業部リサーチャーのいつきです。
ChatGPTは、世界で最も有名なAIチャットボットともいえますが、「ソースが公開されていない」「商用利用するには料金がかかる」といった弱点もあります。
そこで今、多くの方が注目しているのがChatGPTの代替オープンソースです。
オープンソースとして無料で公開されながら、自社用にカスタマイズして開発ができるので、ChatGPTに似た機能を持つAIチャットボットを開発できるとか。
なかでも、代替オープンソースとして注目度の高いMetaのLlama 2は、公開からわずか1週間でダウンロードリクエストが15万を超えるほどの注目を集めていました。
そこで今回は、ChatGPTの代替が務まるおすすめのオープンソースをご紹介します。
最後まで目を通すことで、ChatGPTの代替オープンソースの性能や特徴を理解できるため、自社でAIチャットボットの開発ができるようになるかもしれません。
ぜひ最後までご覧ください。
ChatGPTの代替が務まるおすすめのオープンソース5選!
まずは、ChatGPTの代替が務まるおすすめのオープンソースを5つご紹介します。
- HuggingChat
- Llama2
- ColossalChat
- Alpaca-LoRA
- OpenChatKit
以下で、それぞれのツールの特徴やできることを詳しく解説していくので、ぜひ参考にしてみてください。
HuggingChat
項目 | 内容 |
---|---|
パラメータ | 300億 |
主な機能 | ・文章の生成 ・質問への回答 ・コーディング |
日本語対応 | あり(理解はできるが回答は英語) |
HuggingChatは、Hugging Face上で利用できるAIチャットボットです。OpenAssistantが開発した最新のLLaMaモデルを搭載しており、上記表に記載した機能のように、テキストtoテキスト対応でChatGPTに近いタスクがこなせます。
また、HuggingChatは、300億のパラメータを備えているのが特徴。オープンソースでも最大規模のパラメータを備えていることから、複雑なタスクもこなせることがわかります。
さらに、HuggingChatに入力した情報は、トレーニングや研究の目的で共有されることもありません。これに対して、ChatGPTの無料版では情報をトレーニングや研究目的で共有することがあるので、企業で秘匿性の高い情報を扱うならHuggingChatへの切り替えがおすすめです。
Llama2
項目 | 内容 |
---|---|
パラメータ | 最大700億 |
主な機能 | ・自然会話による対話 ・質問への回答 ・翻訳 ・文章生成 ・AIチャットボットの開発 ・議事録の作成 |
日本語対応 | あり |
Llama2は、Metaが開発してオープンソースで公開しているAI搭載の大規模言語モデルです。最大700億のパラメータを備えており、70億・130億・700億の3つから選べます。
また、GPT-3.5に匹敵する性能を備えているのが特徴。GPT-3.5は1750億のパラメータを備えているので、これに匹敵するとなればかなり効率的なモデルであることがわかりますね!
日本語の出力精度は決して高くありませんが、日本のAIスタートアップ企業「ELYZA」がLlama2をベースに日本語を追加で学習させた「ELYZA-japanese-Llama-2-7b」をオープンソースで公開しているので、こちらもぜひチェックしてみてください。
なお、ELYZA japanese CodeLlama 7bについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
→【ELYZA japanese CodeLlama 7b】日本語版CodeLlamaの性能をGPT-4と徹底比較してみた
ColossalChat
項目 | 内容 |
---|---|
パラメータ | 100億 |
主な機能 | AIチャットボットの開発やトレーニング |
日本語対応 | なし |
ColossalChatは、HPC AI Tech(opens in a new tab)が開発してオープンソースで公開しているフレームワークです。LLaMaモデルとPyTorch AIフレームワークを活用しており、ChatGPTに似た大規模言語モデルを開発できます。
ColossalChatで開発した言語モデルは、迅速な応答やほかのライブラリとの統合、高品質な会話を繰り広げられるのが魅力。英語と中国語による約10万個のQ&Aをデータセットしており、質の高い対話技術を実現しています。
Alpaca-LoRA
項目 | 内容 |
---|---|
パラメータ | 130億、300億、650億 |
主な機能 | AIチャットボットの開発やトレーニング |
日本語対応 | あり |
Alpaca-LoRAは、「Alpaca」のモデルをLoRAという手法でファインチューニングしたモデルです。ハードウェアとの互換性があり、13b・30b・65bと拡張できるパラメータが小さいことから、MacBook上などでも動作します。
Alpaca-LoRAはおもに言語モデルの開発やトレーニングを行えるのが特徴。日本語データを学習させれば、日本語のプロンプトに対応できるAIチャットボットを開発できます。
OpenChatKit
項目 | 内容 |
---|---|
パラメータ | 200億、70億 |
主な機能 | AIチャットボットの開発やトレーニング |
日本語対応 | あり |
OpenChatKitは、AIチャットの開発やトレーニングができる開発キットです。構造面でGPTモデルに似ているものの、検索システムを搭載しているので、拡張性の高いモデルをトレーニングできます。
OpenChatKitの機能詳細をまとめました。
- GPT-NeoXT-Chat-Base-20Bのトレーニング
- Llama-2-7B-32K-betaなど、7Bパラメーターの大規模言語モデルの微調整
- Pythia-Chat-Base-7Bのトレーニング
- いずれかのチャットモデルを使用した推論のテスト
- 検索システムを活用したモデルの拡張
拡張性の高いAIチャットボットを開発したい方は、ぜひチェックしてみてください。
なお、AIチャットボットの作り方について詳しく知りたい方は、下記の記事を合わせてご確認ください。
→AIチャットボットの作り方は?自社開発とツール活用の場合に分けて徹底解説!
ChatGPTとオープンソースを比較してみた
ChatGPTの代替が務まるオープンソースを検討するうえで、両者の比較が気になっている方は多いと思います。
そこで、日本語処理能力とパラメータ数の2つに分けて、当記事で紹介したオープンソースを参考に比較してみました。
比較項目 | ChatGPT | オープンソース |
---|---|---|
日本語処理能力 | 比較的高い | 低い |
パラメータ数 | gpt-3.5:1750億 gpt-4.0:非公開(推定5,000億以上) | 70億〜700億 |
それぞれ比較詳細は、以下で解説していきます。
ChatGPTとオープンソースの日本語処理能力
AI | 日本語処理能力 |
---|---|
ChatGPT | 比較的高い |
HuggingChat | 低い(回答は英語) |
Llama2 | 低い |
ColossalChat | 日本語非対応 |
Alpaca-LoRA | 低い(学習次第) |
OpenChatKit | 低い(学習次第) |
ChatGPTと当記事で紹介したオープンソースの日本語処理能力を比較してみました。基本的に、オープンソースは発展途上段階であることが多く、日本語の処理には適していません。
Alpaca-LoRAやOpenChatKitなどのトレーニングキットは、日本語データの学習量次第で日本語処理能力を高められますが、やはりChatGPTほどの処理能力を与えるのは困難だと思われます。
そこで筆者もChatGPTとオープンソースで日本語処理能力を実際に比較してみました。オープンソースは、当記事でも紹介しているHuggingChatで検証しています。
プロンプトは以下を入力しています。
レオナルド・ダ・ヴィンチがモナリザを描いたのはいつですか?
このプロンプトを入力したのは、以前ChatGPTがハルシネーションを起こしたとして問題になったためです。
2023年3月22日以前のGPT3.5モデルでは、「レオナルド・ダ・ヴィンチは1815年にモナリザを描いた」と回答しているとのこと。実際は1503~1506年、もしくは1517年まで制作が続いたといわれています。
参考記事:ChatGPT: What Are Hallucinations And Why Are They A Problem For AI Systems
そして、筆者が2023年12月時点でChatGPTに質問した結果がこちら。
以前とは異なり、正確な回答が得られています。日本語の説明も自然ですね!
一方、HuggingChatの回答結果がこちら。
レオナルド・ダ・ヴィンチはモナリザを描いていない。モナリザとして知られる絵画は、16世紀初頭、具体的には1503年から1506年にかけて、イタリアの芸術家レオナルド・ダ・ヴィンチによって描かれた。これは彼の最も有名な作品の一つであり、史上最高の絵画の一つと広く考えられている。
モナリザの制作時期は合っているものの、翻訳しても日本語の文章がおかしい状態になっています。いくら日本語を理解できるとはいえ、ChatGPTの品質には届いていないことがわかりますね。
パラメータ数
AI | パラメータ数 |
---|---|
ChatGPT | gpt-3.5:1750億 gpt-4.0:非公開(推定5,000億以上) |
HuggingChat | 300億 |
Llama2 | 最大700億 |
ColossalChat | 100億 |
Alpaca-LoRA | 130億、300億、650億 |
OpenChatKit | 200億、70億 |
ChatGPTと各オープンソースのパラメータ数を比較してみました。表をみればわかるとおり、ChatGPTとオープンソースでは、パラメータ数に大きな差があります。
なお、AIにおけるパラメータ数とは、機械学習モデルが学習中に最適化する必要のある変数の数のことです。パラメータ数が多いほど複雑なタスクをこなせるようになり、表現も豊かになります。
ただし、モデルのサイズが大きいため、ストレージやメモリの容量を多く消費するというデメリットも。よって、開発するモデルの規模や用途によっては、必ずしもパラメータ数は多いのほうが望ましいとは限りません。
なお、Llama2はChatGPTのパラメータ数に大きく劣るものの、gpt-3.5に迫る性能を発揮したという論文も公表されています。
参考記事:Llama 2: Open Foundation and Fine-Tuned Chat Models
上記の参考記事からPDFをダウンロードすると、以下のような図面があります。
こちらは、Llama2と各LLMの性能を比較したもので、ChatGPTとの比較は1番右側に記載されています。こちらを参照すると、ChatGPTに勝っているわけではないものの、同等の性能を発揮していることがわかります。
よって、現状ではChatGPTのgpt-4.0の性能に届きませんが、オープンソースがgpt-4.0と肩を並べる日が来る可能性は十分あるといえるでしょう。
ChatGPTをオープンソースで代替するメリット
ChatGPTをオープンソースで代替すると、以下3つのメリットがあります。
- 利用料金が無料
- ChatGPTに似たAIチャットボットを開発できる
- ChatGPTのようにユーザー過多で遅延しない
以下で、それぞれのメリットを詳しくみていきましょう。
利用料金が無料
オープンソースは、GitHubなどのサイトにソースコードを無償で公開しているため、利用する際に料金が発生しません。ライセンスによって商用利用もできるので、企業がAIチャットボットを開発して販売することもできます。
一方、ChatGPTは無料プランもありますが、ChatGPTを商用利用できる有料プランは月額20ドル(日本円でおよそ2,800円)がかかります。よって、毎月のコストを節約したい方は、オープンソースの代替もぜひ検討してみてください。
ChatGPTに似たAIチャットボットを開発できる
当記事で紹介したようなオープンソースを利用すれば、ChatGPTと似た機能を持つAIチャットボットを開発できます。質問への回答や文章作成、コーディングや翻訳といった機能を追加できるので、AIチャットボットとして十分快適に利用できるでしょう。
また、オープンソースで開発するAIチャットボットは、ChatGPTほどのパラメータを有していないので動作が軽いのも魅力です。ある用途に特化したトレーニングを行えば、ChatGPTより快適に利用できるかもしれません。
ChatGPTのようにアクセス過多で遅延しない
ChatGPTへアクセスしているユーザー数は、2023年9月時点で273万人いたと報告されています。徐々に減少傾向にあるものの、一時期はアクセス過多で遅延していたくらいなので、不便に感じていた方は多いはずです。
しかし、オープンソースで開発したAIチャットボットを使えば、利用者数が少ないためアクセス過多で悩まされることがありません。AIチャットボットからの回答を安定して早く得たい方は、オープンソースによる代替を検討してみてください。
なお、生成AI開発の環境の作り方を詳しく知りたい方は、下記の記事を合わせてご確認ください。
→生成AI開発のベストな環境の作り方!エンジニアが開発の流れを解説
ChatGPTの代替オープンソースを利用しよう
ChatGPTの登場以来、多くの企業や開発者が代替ツールの開発を進めています。オープンソースに公開されているコードは、発展途上ではあるものの、すでにChatGPTに近い性能を備えるまでに進化していきているのも事実です。
当記事で紹介したChatGPTの代替オープンソースを再度まとめました。
- HuggingChat
- Llama2
- ColossalChat
- Alpaca-LoRA
- OpenChatKit
とくに、Llama2はgpt-3.5と同等の性能を備えているといわれています。オープンソースのなかでは、トップクラスのパラメータ数なので、表現豊かなAIチャットボットを求めている方におすすめです。
また、ChatGPTとオープンソースを比較すると、以下のようになります。
比較項目 | ChatGPT | オープンソース |
---|---|---|
日本語処理能力 | 比較的高い | 低い |
パラメータ数 | gpt-3.5:1750億 gpt-4.0:非公開(推定5,000億以上) | 70億〜700億 |
日本語処理能力とパラメータ数の比較結果から、まだまだChatGPTのほうが上位の性能を有していることがわかりました。それでも、オープンソースは目覚ましい速度で進化を続けているので、ChatGPTの性能を凌駕する日が来るかもしれません。
なお、ChatGPTをオープンソースに代替すると、現時点でも以下のようなメリットがあります。
- 利用料金が無料
- ChatGPTに似たAIチャットボットを開発できる
- ChatGPTのようにユーザー過多で遅延しない
オープンソースを利用してChatGPTを代替できれば、コスト削減や利便性の向上につながる可能性があるので、ぜひ1度利用してみてください。
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、サービス紹介資料もご用意しておりますので、併せてご確認ください。