X (Twitter)

兩分鐘跟初學者講懂RAG Agents RAG Agents 是什麼？ RAG Agents 是一種智能體，它從使用者指定的知識來源（如文件、資料庫）中檢索相關上下文，把它當作錨點來指導推理，然後產生答案或執行行動（如呼叫工具）。關鍵優勢在於提供引用來源和校驗日誌，避免「幻覺」問題，確保輸出可靠且可驗證。核心步驟：從檢索到校驗· 檢索（Retrieve）：擴展查詢關鍵字，搜尋索引或資料庫，排序命中結果。 · 錨定（Ground）：從結果中挑選最相關片段（如文字或表格）。 · 推理（Reason）：基於這些上下文合成答案或行動計劃，僅使用可靠資訊。 · 行動（Act）：輸出回應、呼叫工具（如SQL 查詢、網路搜尋、郵件發送）或產生內容。 · 校驗（Audit）：驗證引用準確性、事實性和合規性；記錄追蹤日誌，以便於重播和調試。架構概述· RAG 模組：核心是查詢嵌入（Query Embedding），透過嵌入模型將使用者問題轉換為向量，匹配向量資料庫中的候選內容。 LLM 在此處理上下文，產生初步回應。 · AI 智能體模組：LLM 驅動的智能體，連接使用者輸入，整合RAG 輸出，並擴展到外部工具。 · 外部擴充：包括網路搜尋、API 呼叫（如外部服務），甚至「接管控制」。整體架構分層：索引層（向量儲存或混合搜尋）、檢索器（查詢重寫與過濾）、重新排序器（提升精度）、閱讀/推理器（LLM 產生）、引用機制（附來源連結）和控制器（協調重試與工具呼叫）。此外，強調可觀測性：追蹤查詢、延遲和成本。有效的檢索模式為提升召回率和精確度，執行緒推薦實用技巧： · 混合搜尋：結合關鍵字（BM25）和向量搜索，平衡廣度和準確性。 · 查詢重寫：擴展縮寫、同義詞或時間過濾，避免遺漏。 · 多跳檢索：先檢索生成子查詢，再二次檢索，處理複雜問題。 · 重新排序：對前50–200 結果重新評分，選出最佳5–10 個。 · 結構化檢索：針對事實用SQL/圖資料庫，敘事內容用文檔。分塊與上下文優化處理知識來源時，關鍵是「切塊」（chunking）策略： · 自適應分塊：200–800 個token 長度，重疊10–20%，方便嵌入。 · 表格感知：優先用SQL 提取行/聚合，而非純文字。 · 節頭保留：保持標題/ID，方便引用和重組。 · 時效性：新增時間戳，優先最新資訊解決衝突。

来自 meng shao（@shao__meng）的推文线程

作者信息

线程正文