X (Twitter)

RAGは死んだ？RAGは生き続ける！—インテリジェントエージェント時代の高精度検索 @LightOnIO チームによる記事「RAG は死んだ。RAG 万歳」は、LLM の急速な発展における RAG の進化を検証しています。著者らは、RAG はロングコンテキストウィンドウに置き換えられたのではなく、特にエージェント駆動型 AI システムの時代において、よりインテリジェントで効率的な「条件付き注意」メカニズムへと進化したと主張しています。核心論点：長いコンテキストはRAGの終焉ではない。本稿はまず、よくある誤解を指摘することから始まる。LLMの拡張コンテキストウィンドウは、モデルが大量の情報を一度に「飲み込む」ことができるため、RAGは不要になる、と多くの人が考えている。しかし、著者らはデータと類推を用いてこれを反駁する。長いコンテキストは強力である一方で、高いコスト、非効率性、そしてパフォーマンスの低下ももたらす。例えば、1000ページに及ぶ知識ベース全体（約60万トークン）をキューに詰め込むと、「注目度の希薄化」、つまり重要な情報が埋もれてしまう現象が発生する。これは「中間で迷子になる」現象に似ている。HELMETなどのベンチマークテストでは、長いシーケンスではモデルの再現精度が20～30%低下する可能性があることが示される。より実践的な観点から言えば、これは費用対効果に関するものです。典型的なワークロード（例えば、1日100クエリ）の場合、RAGは対象フラグメントを5つ取得するだけで済むため、ロングコンテキストに比べて8～82倍安価で、レイテンシも低くなります。著者らは、様々なシナリオをシミュレートできるオンライン計算機を提供しており、キャッシュを考慮しても、ロングコンテキストの生成時間が依然としてコストの大部分を占めることを示しています。分かりやすい例えで言えば、ロングコンテキストは会議で全員を招いて簡単な問題について議論するようなものであり（コストが急騰します）、RAGは専門家に的確に相談するようなものであり（効率的で正確です）、といった具合です。マルチモーダルかつ条件付き検索：RAGのアップグレードパス RAGの復活は、インテリジェントエージェントの時代に適応し、「ブラインド検索」から「条件付き意思決定」へと移行することにあります。この記事では、このスタック型アーキテクチャの階層的な分析を提供します。 • 取得タイミング（IF）: エージェントは、クエリの種類、適時性、セキュリティ要件に基づいてツールをルーティングします。例えば、「2+2」のような単純な計算では取得は不要ですが、財務レポートのクエリではアクティブ化が必要です。 • 取得するもの (WHAT): エンティティを識別してクエリを書き換えることで、メタデータフィルタリング (時間範囲、部門など) を追加し、無関係なノイズを回避します。 • 検索場所と方法：動的な戦略選択。コードの場合は語彙検索（例：grep）、散文の場合は意味的混合、マルチモーダルコンテンツ（例：チャート）の場合は視覚的埋め込みモデルと並べ替えツール（例：MonoQwen）など。これにより、従来のツールの限界を克服できます。grepは高速ですが、画像や空間関係（例：ケースの上にあるコンポーネントは何か？）の検索には苦労します。マルチモーダル処理も注目すべき点の一つです。記事では、企業データの70%以上がプレーンテキストではない（グラフやコードなど）と指摘しています。長いコンテキストでは画像を「見る」ことはできますが（画像1枚あたり1～1,500トークン必要）、コストは急騰し、理解も表面的なものに留まります。RAGは、メタデータをオフラインで事前コンパイル（構築済みのマルチモーダルセットなど）することで、リアルタイムかつ効率的な検索を実現し、錯覚を軽減し、企業への適用性を向上させます。評価と将来展望：パイプラインからインテリジェントエコシステムへ。著者は、RAGシステムの成功は「きめ細かな評価」にかかっていると強調しています。つまり、エンドツーエンドの出力（精度など）を見るだけでなく、ルーティングのF1スコア、クエリ理解の再現率向上、検索精度、再ランク付け前後の比較、生成の忠実度など、段階ごとに評価を細分化することです。これにより、障害を特定し、最適化を推進し、「ブラックボックス」のジレンマを回避することができます。記事では、RAGのハイプサイクルを振り返り、2023年のピーク（ベクトルデータベースブーム）、そして2024年から2025年にかけての「終焉」レトリック（MCP、Claude Codeのgrep）について説明していますが、これらはあくまでも進化の過程に過ぎません。2025年までにRAGはインテリジェントエージェントに深く組み込まれ、静的なパイプラインから動的な意思決定モジュールへと移行し、フルコンテキストを用いた一般化クエリとターゲット検索を用いた精密クエリといった長いコンテキストを補完すると予測しています。結論として、本稿では「事前思考型検索」のためのインテリジェントなパイプライン、すなわち事前計算済みメタデータ、ハイブリッド戦略、そしてマルチモーダルツールを推奨します。これは単なる技術的な反復ではなく、AIがインテリジェントエージェントへと変革していく上で避けられないステップです。効率的で信頼性の高い検索は、企業がチャットボットから複雑な意思決定システムへと飛躍していく上で、大きな力となるでしょう。

meng shao（@shao__meng）のスレッド

作者情報

スレッド内容