生成AI活用におけるRAGとナレッジグラフの最新動向
企業における生成AIの活用が進む中、特定の企業文脈に沿った回答を生成するためのアプローチとして、RAG(Retrieval Augmented Generation)とファインチューニングが注目されています。
特に、少ないリソースで企業独自の情報を活用できるRAGアプローチが広く採用されています。
- RAGは企業独自の情報活用を促進します。
- 類似性検索の限界が精度面で明らかです。
- ナレッジグラフでより精度高い回答が可能です。
RAGは、大規模言語モデル(LLM)による生成と、企業の外部情報ソースを組み合わせる手法です。
たとえば、社内チャットボットに休暇規定に関する質問が投げかけられた際、このシステムは関連する社内ドキュメントを検索し、回答を生成します。
このプロセスの核となるのが類似性検索であり、質問に対して最も関連する情報を抽出します。
しかし、最近の調査によると、類似性検索に基づくRAGには精度の限界があることが明らかになりました。
Writer社が実施したRobustQAベンチマークの結果では、RAGの精度は60~70%にとどまり、さらなる改善が求められています。
また、回答生成に1秒以上かかる現状も浮き彫りとなりました。
この限界を克服するため、Writer社は新たなナレッジグラフを活用したRAGシステムを導入しました。
ナレッジグラフは、データ間の意味的な関係を構造化し、複雑な情報を正確に表現する技術です。
従来の類似性検索とは異なり、意味的なつながりを重視するため、より精度の高い回答を生成できるとされています。
たとえば、企業の情報システムに関するナレッジグラフでは、ファイアウォールとクラウドサーバーの関係や、データ暗号化ポリシーとSSL・TLS技術の関連を明確に示すことが可能です。
これにより、単純なキーワード検索やベクトル検索では難しかった複雑な質問にも、文脈を考慮した包括的な回答を提供できます。
Writer社の新システムは、1,000万ワード(約2万ページ分)のデータを検索対象とし、精度86.31%、応答速度0.6秒という優れたパフォーマンスを示しました。
このように、ナレッジグラフの活用により、企業独自の知識に基づいた高度なAIソリューションが今後も進化していくことが期待されています。
参考記事:AMP
「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、朝の通勤時間に読めるメルマガを配信しています。
最新のAI情報を日本最速で受け取りたい方は、以下からご登録ください。
また、弊社紹介資料もご用意しておりますので、併せてご確認ください。