跟頂尖AI 團隊學「上下文工程」 透過「資訊提純、狀態同步、動態剪裁、性能加速」四種手段打造具備「感知、篩選、精煉與持久化」能力的AI Agent。 一、資訊提純:確保模型只接收高價值的背景訊號在上下文工程中,「信噪比」決定了Agent 的推理上限。當模型面對海量程式碼庫或長文件時,簡單的RAG 向量匹配已經無法滿足需求。 1. 語意補全 Anthropic 和Chroma 的研究指出,傳統的片段檢索會導致資訊孤島。情境工程的核心在於「預處理」,即在儲存每一個資訊片段時,利用模型提前為其註入全局背景。例如,在索引一段程式碼時,上下文工程會強制加入其所屬的專案架構訊息,確保檢索出來的內容自帶「自解釋性」。 2. 動態重排序上下文工程不相信原始檢索結果的排序。它強調在資訊進入模型Context 之前,必須經過一道「提純」工序。透過輕量級模型對檢索到的Top-N 結果進行二次評估,剔除與當前指令邏輯無關的干擾項,從而防止模型在長文本中迷失。 二、 狀態同步:將外部執行環境即時映射到模型認知一個成熟的Agent 不應該只生活在對話框裡。情境工程的第二個核心,是將「物理環境」即時映射到模型的認知。 1. 即時系統鏡像 Cline 和Manus 的實踐表明,上下文工程需要將文件樹、終端輸出、甚至當前的UI 狀態即時編織進Context 中。這意味著Context 不再是靜態的文本,而是一個動態更新的「儀表板」。模型執行完一步操作後,環境回饋(成功、報錯或輸出結果)必須第一時間、以標準化的格式追隨在Context 末端。 2. 目標迴響與任務錨定在長路徑任務中,模型容易產生「漂移」。優秀的上下文工程會在Context 的關鍵位置(如對話結束或系統提示詞中)重複錨定當前的主線目標。這種技術被稱為「目標迴響」,它能確保模型在處理複雜的子任務時,始終記得最初的使用者意圖。 三、 動態剪裁:透過修剪冗餘記憶來維持長效邏輯脈絡空間是昂貴的,且存在「脈絡腐化」現象。隨著對話輪數增加,早期的無用探索訊息會幹擾後續決策。 1. 自動化壓縮與狀態蒸餾 Ampcode 和Cline 提倡一種「熵減」策略。當上下文接近預設閾值時,系統會自動觸發「蒸餾」機制:將歷史的瑣碎細節進行邏輯總結,僅保留關鍵事實和最終結論。這種方式能將原本冗長的脈絡透過「滑動總結」轉化為精煉的記憶點。 2. 情境分叉與任務隔離針對複雜的問題,情境工程會採取「分叉」策略。當主任務衍生出獨立的子任務時,系統會複製一個乾淨的上下文環境給子任務,只攜帶必要的全域變量,從而實現任務間的干擾隔離,防止不同邏輯線索在同一個Context 視窗中相互碰撞。 四、 效能加速:利用快取機制平衡反應速度與成本最後是關於執行效能。情境工程不僅要解決「準不準」的問題,還要解決「快不快」和「貴不貴」。 1. 提示詞緩存這是Anthropic 等廠商近期推動的最核心工程化進步。在情境工程中,大量的前置資訊(如係統提示、專案基座程式碼、常用函式庫文檔)在不同輪次間是重複的。透過將這些「前綴內容」進行緩存,模型在處理新輸入時無需重新計算重複部分的注意力權重。這不僅大幅縮短了首字產生的延遲,更直接降低了推理成本。 2. 極簡線程與KV 快取復用 Manus 等團隊強調「追加式」上下文。透過精心設計上下文的結構,使得每一輪新的互動都是在前一輪的基礎上進行線性追加,而非重寫。這種工程手段能最大限度地重複使用伺服器端的KV 緩存,讓Agent 在面對大規模程式碼庫時,仍能維持毫秒級的回應回饋。 總結:情境工程的終極目標情境工程的本質,是為AI Agent 建構一套具備「感知、篩選、精煉與持久化」能力的動態記憶體系統。 · 提純解決了「看什麼」的問題。 · 同步解決了「看多廣」的問題。 · 治理解決了「看多準」的問題。 · 效能解決了「看多快」的問題。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
