X (Twitter)

RAG -> Agentic RAG -> Agent Memory 特別喜歡@helloiamleonie 的博客，這篇探討了AI 系統中信息檢索與存儲機制的逐步升級，以一個簡化的心理模型為基礎，解釋了從靜態檢索向動態記憶管理的轉變，幫助讀者理解LLM 如何通過外部工具處理超出其上下文窗口的信息。這一演進的核心在於從「只讀」操作轉向「讀寫」能力，從而實現更個性化和自適應的AI 智能體。 RAG：一次性只讀檢索的起點首先回顧了RAG，這是2020年提出、2023年流行的基礎技術。 RAG 透過外部向量資料庫注入知識，解決LLM 「幻覺」問題。其流程分為兩步驟：離線階段將文件嵌入並儲存；線上階段根據查詢檢索相關上下文，並與提示結合產生回應。例如，偽代碼展示了其簡潔性： · 儲存文件時，產生嵌入並存入資料庫。 · 回答查詢時，一次檢索top-k 結果，注入提示中產生輸出。 RAG 的優點在於高效減少幻覺，但限制明顯：它是「一次性」解決方案，無法評估檢索必要性或相關度；知識源單一，且無學習機制，無法從互動中迭代。這使得它適合簡單問答，但不適用於複雜、連續對話場景。 Agentic RAG：工具呼叫下的動態唯讀為了克服RAG 的剛性，文章引入Agentic RAG，將檢索視為智能體可呼叫的「工具」。智能體不再被動檢索，而是主動判斷是否需要呼叫工具（如資料庫搜尋或網路查詢），並評估結果的相關性。這引入了循環機制：LLM 產生回應，若需工具，則執行並回饋結果，直至無需工具。在偽代碼中，智能體透過工具呼叫（如SearchTool）實現動態檢索，訊息歷史逐漸累積。這提升了靈活性－智慧體能選擇合適工具，避免無關資訊注入。但它仍停留在「唯讀」層面：資訊僅在離線階段存儲，無法即時修改或個人化，無法從用戶互動中「學習」。智能體記憶：讀寫操作的突破核心在於智慧體記憶（Agent Memory），它將Agentic RAG 擴展為讀寫系統。透過新增「寫入工具」（如WriteTool），智能體不僅能檢索，還能儲存、更新或刪除資訊。這實現了從互動中學習的閉環：例如，記錄使用者偏好（如使用表情符號的習慣）或事件（如生日），並在後續對話中檢索。偽代碼展示了這個循環：回應中若有寫入操作，則將資訊存入資料庫，回饋確認。這直接解決了前兩者的痛點——動態儲存支援即時適應，個人化檢索提升用戶體驗。文章舉例說明：智能體可儲存對話摘要或原始歷史，實現「記住」功能，而非僅「回憶」。簡化模型的限制與實際考量 Leonie 坦承，這個模型是簡化的，未涵蓋多源記憶（如程序性記憶：使用表情；情節記憶：使用者旅行計劃；語義記憶：事實知識）或高階管理策略（如MemGPT 中的記憶合併與遺忘）。讀寫能力雖強大，但引入新風險，如記憶腐敗（過時資訊幹擾）或管理負擔。實際實作需結合事件偵測、摘要產生等技術，確保可擴充性。文章地址

来自 meng shao（@shao__meng）的推文线程

作者信息

线程正文