【DocsGPT】GPT-4を使って自分専用AIチャットボットを作れるオープンソース
DocsGPTは、LLMを利用して、あらゆる形式のドキュメントの情報を認識し、質問に答えてくれるドキュメンテーションアシストツールです。
このサービスを使えば、もう自分でドキュメントを読んで情報を探す必要はなくなります。社内のドキュメントを読み込ませて、チャットボットのように使うことも可能かもしれません。
世間からの注目度も高く、GitHubのスター数は1万を超えています!
今回は、DocsGPTの概要や使い方、実際に使ってみた感想をお伝えします。
是非最後までご覧ください。
DocsGPTの概要
DocsGPTは、ドキュメント内の情報を簡単に見つけるために提案された、最先端ドキュメンテーションアシストツールです。
ChatGPTや独自のLLMを統合し、タスクによって使い分けることができるため、ユーザーは最適なLLMを選択してテキストで質問をすることで、正確な回答を得ることができます。
このサービスを使うことで、ドキュメントから特定の情報を見つけるために、手動で検索するという面倒な作業から解放されます。
そんなDocsGPTの特徴は、以下の4点です。
- ドキュメント入力:技術書やマニュアル、ガイドなど、あらゆるドキュメントを理解して、ユーザーからの質問に的確に回答できます。
- GPTモデルの統合:強力なGPTモデルを統合して、ユーザーがドキュメントに関する質問をテキストで簡単に行うことができ、正確な回答を受け取ることができます。
- オープンソースモデル:DocsGPTはローカルでも実行することができ、DocsGPTに最適化されたオープンソースLMMも公開されています。
- チャットボットインターフェース:直感的で分かりやすい、チャットボットインターフェースを採用しているため、ユーザーは対話形式でツールに質問して、それに対する回答を即座に取得できます。
この後実際に試しますが、ChatGPTのような分かりやすいインターフェースになっているため、直感的に操作ができるので、使いやすいツールだと思います。
DocsGPTはオープンソースのツールなので、ローカルにインストールして使うこともできますが、あらかじめ用意されたサーバー上で使うこともでき、その際はアクセスしてログインするだけで使用できます。
DocsGPTと同じように、強力なLLMを統合し、ファイルや画像入力にも対応したForefrontAIというサービスがあります。詳細は以下の記事をご覧ください。
DocsGPTの料金体系
DocsGPTには、個人向けと企業向けの料金体系が用意されているようで、それぞれについて以下の表にまとめました。
個人向け | Free | Pro |
---|---|---|
料金 | $0/月 | $10/月 |
機能 | ・GPT-3.5、DocsGPTの利用 ・ファイルのアップロード※サイズ制限あり ・ChatBotへの質問※回数制限あり | ・GPT-4の利用 ・ファイルのアップロード※50MBまで ・ChatBotへの質問※回数制限なし ・新機能への優先アクセス |
サポート | – | – |
企業向け | Free | Consumption-based pricing |
---|---|---|
料金 | $0/月 | 相談 |
機能 | 相談 | 相談 |
サポート | 〇 | 〇 |
個人向けのFreeプランについては、ファイルサイズや質問回数の制限が不明ですが、Proプランについては記載がありました。
Freeプランでも、GPT-3.5やDocsGPT向けにLlama2をチューニングした、DocsGPT-7Bが利用できるので、性能的には十分だと思います。
企業向けのプランについてはほとんど情報がないので、おそらく担当者の間で機能や料金を決定するようです。
それでは、実際に使っていこうと思います。
まずは使い方から説明します。
なお、DocsGPTと同様に簡単にAIチャットボットを作れるAIについて知りたい方はこちらをご覧ください。
→【DocsBot】ChatGPTで簡単に自社AIチャットボットを作れる神ツール【使い方~実践まで】
DocsGPTの使い方
今回は、あらかじめ用意されたサーバー上で検証を行います。
まず、以下のサイトにアクセスします。
すると、このような画面になるので、Sing upアカウントを作成してログインします。
アカウント作成は任意の方法で行ってください。
ログインすると、以下のような画面になります。
画面中央のDefault(GPT 3.5)の部分で、使用するLLMを変更できます。
Freeプランでは、GPT 3.5とDocsGPT-7bのみ使用できます。
左側のSource Docsで読み込ませるドキュメントのアップロードと変更ができます。
ファイルをアップロードした後、チャット形式でそのドキュメントに関する質問をすることができます。
基本的な使い方は以上です。とても分かりやすいUIですよね。
それでは早速使っていきましょう!
DocsGPTを実際に使ってみた
学習させるドキュメントは、ChatGPTの関連研究のまとめとLMMの将来の展望を考察した論文のPDFです。
この論文は、AI倫理についてや人間とChatGPTのコラボレーション、ChatGPTの課題や様々なツールに統合するための研究について述べられています。
以下のリンクから論文を読むことができるので、興味のある方は読んでみてください。
Summary of ChatGPT-Related Research and Perspective Towards the Future of Large Language Models
早速使っていきましょう。
まず、ドキュメントファイルをアップロードします。
学習には数分かかりました。
今回は、Freeプランで試しているので、アップロードできるファイルサイズに、どのくらいの制限があるか不明ですが、このPDFは1MBもないのでさすがに大丈夫でした。
おそらくほとんどのドキュメントはFreeプランでもアップロードできるでしょう。
学習が完了したら、画像のようにSource Docsでpdfが選べるようになるので、選択します。
選択したら、あとはテキストボックスに質問を入力するだけです。
DocsGPTは英語推奨とのことだったので、英語で以下の質問してみました。
What is this pdf talking about?
結果はこのようになりました。
見やすいように、出力結果の本文と日本語訳を書き出します。
The PDF is discussing various aspects related to ChatGPT, a large language model developed by OpenAI. It provides a summary of research conducted on ChatGPT and explores different perspectives on its use and implications.
Some of the key topics covered in the PDF include:
・AI Ethics: The potential negative impacts of ChatGPT are discussed, including concerns about plagiarism, cheating, and the influence of ChatGPT's political and ethical tendencies on users' behavior and decision-making.
・Cueing Techniques: The use of cue engineering to effectively interact with large language models like ChatGPT is explored. It presents a framework for cueing models and provides examples of cueing patterns.
・Human-ChatGPT Collaboration: The concept of collaboration between humans and machines is discussed, highlighting how ChatGPT can enhance human productivity and creativity. Examples of collaborative applications, such as software architecture and design tasks, are provided.
・ChatGPT Integration: The integration of ChatGPT into different systems and software components is explored. It discusses how ChatGPT's natural language processing abilities can facilitate communication between non-technical users and systems.
Overall, the PDF provides insights into the research, challenges, and potential applications of ChatGPT, shedding light on its capabilities and limitations.
このPDFは、OpenAIが開発した大規模な言語モデルであるChatGPTに関する様々な側面について論じています。ChatGPTに関する研究の要約を提供し、その使用と意味合いに関する様々な視点を探求しています。
PDFで取り上げられている主なトピックは以下の通りです:
AI倫理:盗作や不正行為、ChatGPTの政治的・倫理的傾向がユーザーの行動や意思決定に与える影響など、ChatGPTの潜在的な悪影響について議論しています。
キュー・テクニック:ChatGPTのような大規模な言語モデルと効果的に対話するためのキューエンジニアリングの使用について検討します。モデルをキューイングするためのフレームワークを提示し、キューイングパターンの例を提供します。
人間とChatGPTのコラボレーション:ChatGPTがどのように人間の生産性と創造性を向上させることができるかに焦点を当て、人間と機械間のコラボレーションの概念について議論します。ソフトウェアアーキテクチャやデザインタスクなどのコラボレーションアプリケーションの例が提供されます。
ChatGPTの統合:ChatGPTの様々なシステムやソフトウェアコンポーネントへの統合について検討します。ChatGPTの自然言語処理能力が、非技術的なユーザーとシステム間のコミュニケーションをどのように促進するかを論じています。
全体として、このPDFはChatGPTの研究、課題、潜在的なアプリケーションに関する洞察を提供し、その能力と限界に焦点を当てています。
この論文は何について述べているの?という質問に対し、論文の内容を理解して要点をまとめてくれています。
出力された文章も自然です。
このように、DocsGPTは学習したドキュメントを正確に理解して、ユーザーの質問に答えてくれることが分かりました。
ここからは、さらにDocsGPTを使って、機能を探っていこうと思います!
DocsGPTの機能を検証!
ここからは、「DocsGPT-7b」「日本語入出力」「普通のLLMとして使えるか」を検証していきます。
DocsGPT-7b
先ほどの実際に使ってみたでは、GPT-3.5を使用しましたが、ここではDocsGPT-7bを使って、検証していきます。
論文と質問は先ほどと同様です。
結果はこのようになりました。
The PDF discusses different research and perspective towards the future of large language models (LLMs), specifically ChatGPT.
It highlights the challenges and benefits of LLMs, including their potential to improve various domains, such as writing, search engines, natural language understanding, virtual assistants, and chatbots.
The PDF also highlights some challenges associated with LLMs, such as unintended biases, lack of diversity, inability to perform certain tasks, and risk of misuse.
The document presents some solutions to these challenges, including ensuring diversity and representation in training data, utilizing smaller LLMs for internal processing, and using multi-model approaches.
The PDF also discusses the risks associated with large language models, such as bias, privacy, and abuse, and suggests a proactive research approach to address these issues.
Overall, the document provides an overall perspective on the development and future of large language models, highlighting both their benefits and challenges.
こちらは箇条書きではなく、長々とした文章で出力されました。
見やすさは断然GPT-3.5ですが、この論文が何を言いたいのか具体的に教えてくれたのはDocsGPT-7bの方です。
やはり、ドキュメントから情報を抜き出すことに特化しているからか、文章の要約がうまいように感じます。
日本語入出力
日本語入出力に対応しているかどうかは、皆さん気になっているところでしょう。
まずは、先ほどのPDFに関する質問を日本語でしてみました。モデルはデフォルトのGPT-3.5を使用します。
結果はこのようになりました。
この論文は、ChatGPTに関連する研究と、大規模言語モデルの将来に向けた展望についてまとめられています。
ChatGPTは、科学、哲学、法律などの分野でも重要な役割を果たしており、帰納的推論と演繹的推論の2つの推論のタイプがあります。
この論文では、ChatGPTの帰納的推論の能力を活用してテキストの意味を捉え、定義された指標を使用してテキストをスコアリングする試みがいくつか紹介されています。
また、ChatGPTの推論能力の評価も行われており、意思決定や空間的推論、曖昧さの特定などの領域でのパフォーマンスが検証されています。
さらに、データの抽出、変換、強化、処理におけるChatGPTの役割や、データの可視化における応用も紹介されています。
また、ChatGPTのユーザーへの負の影響や制限事項、そして将来の展望についても議論されています。
例えば、情報の陳腐化や理解の不足、エネルギー消費、悪意のある利用、バイアスや差別、プライバシーやデータセキュリティの問題などが挙げられています。
論文ではさらに、これらの制限事項に対処するための将来の方向性
このようにしっかり日本語に対応していますが、トークン数に制限があるのか、途中で文章が途切れてしまっています。
恐らくProプランではトークン数はもっと多くなるはずなので、本格的に使おうという方はProプランにすることをお勧めします。
また、日本語のドキュメントにも対応しているか気になったので、検証します。
こちらの、大規模言語モデルによる高品質反論文の自動生成の論文を学習させて、日本語で質問してみます。
結果は以下のようになりました。
この論文は、大規模な言語モデルであるGPT-3を使用して、教育者が批判的思考能力を育成するのに役立つ効果的な反論を生成する可能性を探求しています。
オンラインのディベートフォーラムから反論を収集し、生成された反論と比較することで、生成されたテキストの品質とその品質の向上の可能性を調査しました。
その結果、生成された反論の品質は、論理の正確さや初期の議論との関連性の点で、収集された反論と同等またはそれ以上であることがわかりました。
BERTSc上で生成された反論と収集された反論の間には高い類似性がありました。
このように、日本語のドキュメントを日本語で質問して、ちゃんとした回答をしてくれることが分かりました。
これは日本人の私たちのからすると、とても便利ですよね!
普通のLLMとして使えるのか
最後に、普通のLLMとして使えるのか気になったので、検証していきます。
Source Docsで、docsGPT 0.1.0を選択して、いくつか普通の質問をしてみました
結果はこのようになり、ドキュメントに関すること以外の質問にも普通に他のLLMと同等の回答をしてくれることが分かりました。
どうやら普通のChatBotとしても使用できるようですね。
このように、DocsGPTは多くの機能を有しており、ドキュメントの情報を教えてくれるだけでなく、一般的なChatBotとしても使用できるので、強力な作業効率化ツールだといえます。
なお、チャットボットを作る際のエンべディングモデルについて知りたい方はこちらをご覧ください。
→【Text Embedding 3】OpenAIの最新Embeddingモデルの使い方~実際の性能を検証してみた
DocsGPTを活用して作業を効率化しよう!
DocsGPTは、ドキュメント内の情報を簡単に見つけるために提案され、ChatGPTなどの強力なLLMを統合することで、テキストでドキュメントに関する質問をして、正確な回答を得ることができる最先端のAIツールです。
個人向けには、FreeプランとProプランがあり、Freeプランでは機能に制限がありますが、GPT-3.5を使えるなど、十分な機能を使うことができます。
実際に使ってみた感想としては、日本語入出力に対応しているだけでなく、普通のChatBotとしても使用できるので、単なるドキュメンテーションアシストツールではなく、様々な作業に活用できるツールだと感じました。
DocsGPTを活用することで、これまで時間をかけて行っていた作業が、大幅に効率化されることが期待できるので、気になった方は試してみてください!
生成系AIの業務活用なら!
・生成系AIを活用したPoC開発
・生成系AIのコンサルティング
・システム間API連携
最後に
いかがだったでしょうか?
弊社では
・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
・ハルシネーション対策AIツールの開発
・自社専用のAIチャットボットの開発
などの開発実績がございます。
まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。
➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。
セミナー内容や料金については、ご相談ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。