RAG -> Agentic RAG -> Agent Memory 特別喜歡@helloiamleonie 的博客,這篇探討了AI 系統中信息檢索與存儲機制的逐步升級,以一個簡化的心理模型為基礎,解釋了從靜態檢索向動態記憶管理的轉變,幫助讀者理解LLM 如何通過外部工具處理超出其上下文窗口的信息。這一演進的核心在於從「只讀」操作轉向「讀寫」能力,從而實現更個性化和自適應的AI 智能體。 RAG:一次性只讀檢索的起點首先回顧了RAG,這是2020年提出、2023年流行的基礎技術。 RAG 透過外部向量資料庫注入知識,解決LLM 「幻覺」問題。其流程分為兩步驟:離線階段將文件嵌入並儲存;線上階段根據查詢檢索相關上下文,並與提示結合產生回應。 例如,偽代碼展示了其簡潔性: · 儲存文件時,產生嵌入並存入資料庫。 · 回答查詢時,一次檢索top-k 結果,注入提示中產生輸出。 RAG 的優點在於高效減少幻覺,但限制明顯:它是「一次性」解決方案,無法評估檢索必要性或相關度;知識源單一,且無學習機制,無法從互動中迭代。這使得它適合簡單問答,但不適用於複雜、連續對話場景。 Agentic RAG:工具呼叫下的動態唯讀為了克服RAG 的剛性,文章引入Agentic RAG,將檢索視為智能體可呼叫的「工具」。智能體不再被動檢索,而是主動判斷是否需要呼叫工具(如資料庫搜尋或網路查詢),並評估結果的相關性。這引入了循環機制:LLM 產生回應,若需工具,則執行並回饋結果,直至無需工具。 在偽代碼中,智能體透過工具呼叫(如SearchTool)實現動態檢索,訊息歷史逐漸累積。這提升了靈活性-智慧體能選擇合適工具,避免無關資訊注入。但它仍停留在「唯讀」層面:資訊僅在離線階段存儲,無法即時修改或個人化,無法從用戶互動中「學習」。 智能體記憶:讀寫操作的突破核心在於智慧體記憶(Agent Memory),它將Agentic RAG 擴展為讀寫系統。透過新增「寫入工具」(如WriteTool),智能體不僅能檢索,還能儲存、更新或刪除資訊。這實現了從互動中學習的閉環:例如,記錄使用者偏好(如使用表情符號的習慣)或事件(如生日),並在後續對話中檢索。 偽代碼展示了這個循環:回應中若有寫入操作,則將資訊存入資料庫,回饋確認。這直接解決了前兩者的痛點——動態儲存支援即時適應,個人化檢索提升用戶體驗。文章舉例說明:智能體可儲存對話摘要或原始歷史,實現「記住」功能,而非僅「回憶」。 簡化模型的限制與實際考量 Leonie 坦承,這個模型是簡化的,未涵蓋多源記憶(如程序性記憶:使用表情;情節記憶:使用者旅行計劃;語義記憶:事實知識)或高階管理策略(如MemGPT 中的記憶合併與遺忘)。讀寫能力雖強大,但引入新風險,如記憶腐敗(過時資訊幹擾)或管理負擔。實際實作需結合事件偵測、摘要產生等技術,確保可擴充性。 文章地址
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
