DeepRAGとは?仕組み・精度向上の理由・導入メリットを徹底解説

ゼロから始める基礎知識

検索するか、しないかをAIが自ら判断する「DeepRAG」が登場!

従来のRAG(検索拡張生成)は、LLMの限界である“ハルシネーション”を抑える手法として広まりました。しかし、実際には「不要な検索」「ノイズの多い結果」「高コスト」といった新たな課題もあります。

そこで登場したのが、中国科学院ソフトウェア研究所とWeChat AIの研究者らによって提案されたDeepRAG

DeepRAGは、検索と推論のバランスをAIが自律的に判断する手法です。従来のRAGと比べると、約22%の回答精度向上を実現しました。

本記事では、DeepRAGの仕組みから従来RAGとの違い、活用シーンや導入メリットまで詳しく解説します。

ぜひ最後までご覧ください!

DeepRAGの概要

DeepRAGは、従来のRAGを発展させた新たな手法です。

従来手法のRAGでは、非効率なタスクの分解や無駄なテキスト検索が起こり、ノイズや冗長性が生じる、検索と推論の適切なバランスを取ることが難しいなどの課題がありました。

また、LLMは推論能力に長けており、日進月歩で新たなモデルがリリースされますが、ハルシネーションの問題は依然として解決されていません。

従来手法のRAGとLLM、2つの問題を解決するためにDeepRAGは開発されました。

DeepRAGでは、RAGをマルコフ決定過程としてモデル化し、各ステップで外部検索を行うのかLLMのパラメータ知識のみに頼るのかを動的に決定します。

参考:https://arxiv.org/pdf/2502.01142

その結果、DeepRAGは従来手法と比較して回答精度が約22%向上しています。

そもそもRAGとは何か?

そもそもRAGというのは、Retrieval-Augmented Generation(検索拡張生成)の略であり、LLMによるテキスト生成に外部からの情報(PDFなどのテキスト情報)の検索を組み合わせることで回答出力の精度を高め、ハルシネーションを減少させるものです。

わかりやすいサービスとして、Googleが提供しているNotebookLMがあります。NotebookLMはテキスト情報を読み込ませることで、その情報を元にユーザーの質問に回答をしてくれます。このときに回答を生成するのがLLMです。

LLMが回答できる内容は、事前学習で得た知識のみであり、最新情報を回答することはできません。また、専門領域に関する知識も乏しいため、ハルシネーションが起こりやすいです。

一方で、テキスト情報を読み込ませることで、最新情報や専門領域の知識を踏まえた上で回答ができるようになるため、ハルシネーションの抑制が期待できます。

DeepRAGとRAGの違い

LLMのみの回答に比べてRAGはハルシネーションが生じにくいものの、RAGのデメリットもあります。

従来のRAG手法にはいくつかの課題があります。例えば、検索が不要な場合にも実行されるため、計算にかかるコストが増加します。また、サブクエリが適切に生成されないと、検索結果が不正確になることもあります。さらに、モデル内の知識と検索結果を効果的に使い分けることが難しい点も問題です。

そこで、DeepRAGでは検索過程をマルコフ決定過程としてモデル化し、検索が必要な場合のみ検索を行う適応的なアプローチを導入しました。

マルコフ決定過程を取り入れたDeepRAGは、計算コストを抑えながらも高い精度を実現しています。また、この手法は、モデルの知識と検索結果をうまく使い分けることができ、質問を効率的に分解しながら不要な検索を最小限に抑える点でも優れています。

参考:https://arxiv.org/pdf/2502.01142

マルコフ決定過程

マルコフ決定過程とは、意思決定が順番に行われる状況を数学的にモデル化したもので、次の状態は今現時点での状態と行動によってのみ決まり、過去の状態には依存しない、というものです。※1

初めて意中の人とデートに行くときを例にしてみましょう。初めてのデートでは、1.カフェにいく、2.ランチを食べる、3.映画を観るなどいくつもの選択肢があります。このときの選択によって2回目のデートに繋がるか否かが決まります。

カフェに行った場合、次のデートにつながる確率は50%、ランチに行った場合は80%、映画を観る場合は40%の確率で次のデートに繋がるとします。このときに選んだ選択肢によって「報酬(ここでは満足感)」が変化し、満足感が高ければ高いほど次のデートに繋がります。

これがマルコフ決定過程であり、現時点での状態と行動(デートでどこに行くか)によって、次の状態(2回目のデートにいけるかどうか)が決まるというものです。

なお、洗練されたUIのオープンRAGシステムについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

DeepRAGの仕組み

マルコフ決定過程を導入したDeepRAGの仕組みとして、いくつか重要なポイントがあります。

1.Retrieval Narrative

2.Atomic Decision

Retrieval Narrativeは検索過程を適応的かつ構造的に整理し、段階的にサブクエリを生成します。また、以前の検索結果を活用しながら、適切な検索戦略を立てるというものです。

Atomic Decisionは各サブクエリごとに「検索するべきか?」「内部の知識のみで回答できるか?」を判断し、二分木探索を用いた学習により、検索の必要性を適切に評価します。

また、DeepRAGでは3つの段階を通じて学習をしています。

1.二分木探索

二分木探索では、ユーザーからの質問に関連するサブクエリに対して、内部の知識を利用するか外部検索をするのか、異なる戦略に基づいて探索する二分木を作成し、データの合成を行います。

2.模倣学習

模倣学習では二分木探索で合成された最適な推論データに基づいて、モデルの終了とAtomicな決定能力、クエリ分解能力、中間回答生成能力を向上させるためにファインチューニングを行います。

3.連鎖的校正

連鎖的校正では、模倣学習を経て外部知識の取得が必要かどうかをより正確に決定をします。これによりモデルは回答の正確性を高めることができます。

参考:https://arxiv.org/pdf/2502.01142

DeepRAGができること

DeepRAGの活用として、論文の読解が挙げられます。医師をはじめとした医療従事者や研究者の方々は、日々論文を読むかと思います。そういった時にDeepRAGを使えば、エビデンスに基づく治療選択の一助になるでしょう。また、特定の疾患に関する論文をたくさん読み込ませておけば、ニッチな質問もDeepRAGで対応することが可能。

その他にも企業などではオリジナルのChatbotの運用もできるようになるでしょう。自社のサービス内容やよくある質問などを読み込ませ、カスタマーサポートとして活用することで、これまで人力で行っていた対応を自動でできるようになる可能性があります。

また、DeepRAGは従来のRAGに比べて、モデル内部の知識に頼るのか外部知識に頼るのかの判断によって、サブクエリに分解することにより高精度な回答を出力できます。

例えば、「AIとブロックチェーンの融合は今後どうなるのか?」というユーザーからの質問に対して、従来のRAGでは「AIとブロックチェーンの融合」というキーワードのみで検索し、見つかった内容を出力していました。

しかし、それだと最新事例や技術的課題などの回答が漏れてしまいます。サブクエリに分解することで、ユーザーからの質問を4-5個のクエリに分解・回答を生成し、最終的な回答を出力することになるため、より複雑な回答も適切に回答ができるようになるのです。

参考:https://arxiv.org/pdf/2502.01142

なお、リアルな統計データ×RAGを使ったハルシネーション対策極みLLMについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

DeepRAGを活用するメリット

DeepRAGを活用するメリットとしては、「不要な検索を減らし、これまで以上に効率的で高精度な回答が出力される」点です。従来のRAGでは、ユーザーからの質問に対して無条件で検索を行っていたので、不要な情報取得が生じており、計算コストがかかっていました。

しかし、DeepRAGでは、モデル内部情報で解決できるのか外部知識に頼るのかを判断するため、不要な情報取得が減ります。

さらに、DeepRAGではサブクエリに分解して回答することにより、これまで以上に複雑な質問にも対応できるようになっています。

DeepRAGのデメリット

DeepRAGのデメリットとして、これまでの手法に比べ複雑なため実装が難しい点が挙げられます。

また、DeepRAGを選択するのか従来のRAGを使うのかの判断が難しく、本来であれば従来のRAGで十分だったのに、時間と費用をかけてDeepRAGを実装してしまった。ということもあり得ます。

そのため、DeepRAGを実装する際には、本当にDeepRAGが必要なのかを見極める必要があるでしょう。

なお、LLMのハルシネーションを防ぐRAG Fusionについて詳しく知りたい方は、下記の記事を合わせてご確認ください。

よくある質問(FAQ)

DeepRAGはどんな場面で特に有効なのか?

DeepRAGの特徴を踏まえると、複雑な質問への対応が必要な場面や専門的な知識が必要な場面でDeepRAGは効果を発揮します。また、時間経過とともに情報の鮮度が失われていくものに関してもデータソースを元に最新情報を提供できるため、情報の更新が早い分野に関してもDeepRAGは有効的です。

DeepRAGを導入するための要件は?

高品質なデータソース、LLM、外部APIを使用する場合には外部APIの準備が必要です。

他のツールと比較した場合、DeepRAGの利点は?

計算コストを抑えられ、無駄な検索を行わないので結果が冗長的ではない、複雑な質問に対してもサブクエリに分解するため適切な回答が可能といった利点があります。
DeepRAGは「複雑な質問」「信頼性が必要」「最新データが必要」という場面で最大の効果を発揮するでしょう。

まとめ

本記事ではDeepRAGの概要から従来手法のRAGとの違い、活用方法について解説をしました。DeepRAGを実装するには難しさが伴いますが、適切な場面でDeepRAGを使うことができれば、これまで以上にコスト削減に繋げることができるでしょう。

ぜひ本記事を参考にDeepRAGについて学びを深めてください!

最後に

いかがだったでしょうか?

社内ナレッジの属人化や問い合わせ対応の煩雑さに課題を感じていませんか?
RAG(検索拡張生成)を活用すれば、既存ドキュメントから即座に回答を生成し、社内ヘルプデスクや情報共有を大幅に効率化できます。

株式会社WEELは、自社・業務特化の効果が出るAIプロダクト開発が強みです!

開発実績として、

・新規事業室での「リサーチ」「分析」「事業計画検討」を70%自動化するAIエージェント
・社内お問い合わせの1次回答を自動化するRAG型のチャットボット
・過去事例や最新情報を加味して、10秒で記事のたたき台を作成できるAIプロダクト
・お客様からのメール対応の工数を80%削減したAIメール
・サーバーやAI PCを活用したオンプレでの生成AI活用
・生徒の感情や学習状況を踏まえ、勉強をアシストするAIアシスタント

などの開発実績がございます。

まずは、無料相談にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ
無料相談

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、サービス紹介資料もご用意しておりますので、併せてご確認ください。

タイトルとURLをコピーしました