X (Twitter)

跟頂尖AI 團隊學「上下文工程」透過「資訊提純、狀態同步、動態剪裁、性能加速」四種手段打造具備「感知、篩選、精煉與持久化」能力的AI Agent。一、資訊提純：確保模型只接收高價值的背景訊號在上下文工程中，「信噪比」決定了Agent 的推理上限。當模型面對海量程式碼庫或長文件時，簡單的RAG 向量匹配已經無法滿足需求。 1. 語意補全 Anthropic 和Chroma 的研究指出，傳統的片段檢索會導致資訊孤島。情境工程的核心在於「預處理」，即在儲存每一個資訊片段時，利用模型提前為其註入全局背景。例如，在索引一段程式碼時，上下文工程會強制加入其所屬的專案架構訊息，確保檢索出來的內容自帶「自解釋性」。 2. 動態重排序上下文工程不相信原始檢索結果的排序。它強調在資訊進入模型Context 之前，必須經過一道「提純」工序。透過輕量級模型對檢索到的Top-N 結果進行二次評估，剔除與當前指令邏輯無關的干擾項，從而防止模型在長文本中迷失。二、狀態同步：將外部執行環境即時映射到模型認知一個成熟的Agent 不應該只生活在對話框裡。情境工程的第二個核心，是將「物理環境」即時映射到模型的認知。 1. 即時系統鏡像 Cline 和Manus 的實踐表明，上下文工程需要將文件樹、終端輸出、甚至當前的UI 狀態即時編織進Context 中。這意味著Context 不再是靜態的文本，而是一個動態更新的「儀表板」。模型執行完一步操作後，環境回饋（成功、報錯或輸出結果）必須第一時間、以標準化的格式追隨在Context 末端。 2. 目標迴響與任務錨定在長路徑任務中，模型容易產生「漂移」。優秀的上下文工程會在Context 的關鍵位置（如對話結束或系統提示詞中）重複錨定當前的主線目標。這種技術被稱為「目標迴響」，它能確保模型在處理複雜的子任務時，始終記得最初的使用者意圖。三、動態剪裁：透過修剪冗餘記憶來維持長效邏輯脈絡空間是昂貴的，且存在「脈絡腐化」現象。隨著對話輪數增加，早期的無用探索訊息會幹擾後續決策。 1. 自動化壓縮與狀態蒸餾 Ampcode 和Cline 提倡一種「熵減」策略。當上下文接近預設閾值時，系統會自動觸發「蒸餾」機制：將歷史的瑣碎細節進行邏輯總結，僅保留關鍵事實和最終結論。這種方式能將原本冗長的脈絡透過「滑動總結」轉化為精煉的記憶點。 2. 情境分叉與任務隔離針對複雜的問題，情境工程會採取「分叉」策略。當主任務衍生出獨立的子任務時，系統會複製一個乾淨的上下文環境給子任務，只攜帶必要的全域變量，從而實現任務間的干擾隔離，防止不同邏輯線索在同一個Context 視窗中相互碰撞。四、效能加速：利用快取機制平衡反應速度與成本最後是關於執行效能。情境工程不僅要解決「準不準」的問題，還要解決「快不快」和「貴不貴」。 1. 提示詞緩存這是Anthropic 等廠商近期推動的最核心工程化進步。在情境工程中，大量的前置資訊（如係統提示、專案基座程式碼、常用函式庫文檔）在不同輪次間是重複的。透過將這些「前綴內容」進行緩存，模型在處理新輸入時無需重新計算重複部分的注意力權重。這不僅大幅縮短了首字產生的延遲，更直接降低了推理成本。 2. 極簡線程與KV 快取復用 Manus 等團隊強調「追加式」上下文。透過精心設計上下文的結構，使得每一輪新的互動都是在前一輪的基礎上進行線性追加，而非重寫。這種工程手段能最大限度地重複使用伺服器端的KV 緩存，讓Agent 在面對大規模程式碼庫時，仍能維持毫秒級的回應回饋。總結：情境工程的終極目標情境工程的本質，是為AI Agent 建構一套具備「感知、篩選、精煉與持久化」能力的動態記憶體系統。 · 提純解決了「看什麼」的問題。 · 同步解決了「看多廣」的問題。 · 治理解決了「看多準」的問題。 · 效能解決了「看多快」的問題。

來自 meng shao（@shao__meng）的推文串

作者資訊

推文串內容