エンタープライズ アプリケーションにおける RAG (Retrieval Enhancement Generation) の新しい体系的なレビューがここにあります。 企業がRAGを真に活用できるようになるまでには、まだ長い道のりがあります。RAGシステムが量産体制が整っていると想定しないでください。 研究室でのプロトタイプと企業での実際の展開との間のギャップは、ほとんどの人が想像するよりも大きいです。 この体系的な文献レビューでは、2015 年から 2025 年までの出版物を対象に、企業の知識管理とドキュメント自動化における RAG + LLM システムに関する 77 件の高品質な研究を分析します。 調査結果では、集中化されたテクノロジー スタックが明らかになりました。 - 実装の 63.6% で GPT モデルが使用されています。 - 80.5% は、FAISS や Elasticsearch などの標準検索フレームワークに依存しています。 - 66.2% がスケーリングにクラウド インフラストラクチャの使用を好みます。 しかし、「研究室と市場」の間のギャップは依然として大きい。 検索および分類タスクでは、k 分割クロス検証 (93.5%) などの厳密な検証方法がよく使用されますが、生成評価は計算上の制限により、主に静的ホールドアウト データセットに依存します。 調査対象のうち、実際の企業環境に RAG プロトタイプを導入したのはわずか 13% でした。 現在、繰り返し発生する主な課題は次の 5 つです。 - 幻覚のコントロール(研究の48.1%)。 - データのプライバシーとセキュリティ(37.7%) - レイテンシとスケーラビリティ(31.2%) - ドメイン適応(23.4%) - ビジネスへの影響を測定することは困難です (15.6%)。 技術的な指標は十分にカバーされており、精度、再現率、正確度は研究の 80.5% に登場し、ROUGE と BLEU は 44.2% に登場しました。 しかし、人間と機械の連携評価を組み込んだ研究はわずか 19.5% であり、エンドユーザーの成果を測定する実際のケース スタディは依然として不足しています。 ドメイン固有のデータに対する微調整により、通常、ゼロショット方式と比較して、事実上のゲインが 10 ~ 20% 向上します。 ハイブリッド検索(高密度ベクトルと知識グラフを組み合わせたもの)は研究の 23.1% に登場し、一般的に解釈可能性と精度が向上しました。 この研究は、学術的なプロトタイプと生産システム間のギャップを埋めるためのデータ主導のロードマップを提供します。 このテクノロジーは制御された環境で動作しますが、プライバシーを保護した検索、100 ミリ秒未満の遅延、ビジネス中心の評価フレームワークは、企業での導入において依然として課題となっています。 🔖 レポートリンク:
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
