關於企業應用中的RAG(檢索增強生成)最新系統性綜述來了。 企業要真正用好RAG,還有很長的路要走,別想當然地覺得RAG 系統已經可以量產了。 實驗室裡的原型和企業實際部署之間,差距比多數人想像的還要大。 這份系統性文獻回顧分析了77 篇關於RAG + LLM 系統在企業知識管理和文件自動化方面的高品質研究,涵蓋了2015 年到2025 年中的出版品。 研究結果揭示了一個集中的技術堆疊: - 63.6% 的實作使用GPT 模型。 - 80.5% 依賴像FAISS 或Elasticsearch 這樣的標準檢索框架。 - 66.2% 傾向於使用雲端基礎設施進行擴展(scaling)。 但「從實驗室到市場」的差距仍然很大。 雖然檢索和分類任務經常使用嚴格的驗證方法,例如k-fold 交叉驗證(93.5%),但由於計算限制,生成式評估主要依賴靜態的hold-out 資料集。 只有13% 的研究在實際的企業環境中部署了RAG 原型。 目前主要有五個反覆出現的挑戰: - 幻覺控制(48.1% 的研究)。 - 資料隱私和安全(37.7%)。 - 延遲和可擴展性(31.2%)。 - 領域自適應(23.4%)。 - 難以衡量業務影響(15.6%)。 技術指標涵蓋得很好,80.5% 的研究中出現了精確率、召回率和準確率,44.2% 出現了ROUGE 和BLEU。 但是,只有19.5% 的研究中出現了人機協作評估,而衡量最終用戶結果的真實案例研究仍然很少。 在領域內資料上進行微調,通常比zero-shot 方法提高10-20% 的事實性增益。 混合檢索(將密集向量與知識圖譜結合)出現在23.1% 的研究中,通常可以提高可解釋性和精確度。 這項研究為彌合學術原型和生產系統之間的差距提供了一個數據驅動的路線圖。 這項技術在受控環境中有效,但是,保護隱私的檢索、低於100 毫秒的延遲以及以業務為中心的評估框架仍然是企業部署面臨的公開挑戰。 🔖 報告連結:
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
