Anthropic 提出了一種雙層智慧體設計 解決Agent執行長任務時遺失記憶的問題 隨著Claude 等AI 模型變得更強,開發者希望它們能夠: 執行複雜任務(如全端開發) 持續工作數小時甚至數天 但每次情境視窗刷新後,AI 都會失去記憶,無法連續推進任務。 這就像一個工程團隊輪班工作,但每個新工程師上崗時都完全不知道前一班做了什麼。 傳統長任務執行的兩個主要失敗模式: 1、試圖一次完成所有任務(one-shot) Claude 會在一個視窗中嘗試建立整個應用,結果中途上下文耗盡,留下“半拉子工程”,下一次啟動又得重新理解。 2、過早宣告任務完成 當專案部分功能完成後,Claude 有時會錯誤判斷為「任務已結束」。 這兩種問題都導致任務狀態不連續、情境斷裂。 為什麼這很難解決? AI 模型的「記憶」並不是持久的。 每次上下文視窗結束,它就像「重啟的電腦」一樣,什麼都不記得。 雖然Anthropic 為Claude 做了「上下文壓縮(compaction)」 功能,可以把對話濃縮後帶入下一輪 但這還不夠,因為AI 仍然會失去結構化的專案狀態。 Anthropic 的解決方案:雙智能體架構(Two-Agent Harness) 為解決這些問題,Anthropic 設計了一種新的智能體工作架構,稱為: 雙智能體長運行框架 它由兩類AI 角色協同完成整個任務過程: Initializer Agent(初始化智能體) Coding Agent(編碼智能體) 這兩個智能體並非兩種模型,而是同一個Claude 模型在不同階段使用不同的提示模板(prompt template)運行。 差別在於它們的職責分工與脈絡約束。 🧩 第一成員:Initializer Agent(初始化智能體) Initializer 的任務是: 為專案建立結構化的“工作記憶” 創造清晰、永續的開發環境 它只在專案第一次啟動時運行,做「專案準備」: 第一次啟動時,這個智能體負責: 創造整個工作環境; 寫下一個初始化腳本https://t.co/VUeBdiSpyr; 產生一個專案進度檔claude-progress.txt; 建立Git 倉庫(用於版本管理)。 💡 它相當於專案的“開工儀式”,幫後續AI打好地基。 🧑💻 2. 編碼智能體(Coding Agent) 在接下來的每一次運行中,這個智能體會: 閱讀進度日誌和Git 記錄; 查看「要做的功能清單」; 只實現一個小功能; 寫好註解、測試程式碼; 保存清晰的Git 提交; 更新進度日誌後退出。 💡 每次運行就像接力賽中的一棒:做一件小事、記錄清楚、交給下一位。 實測結果:真的更聰明了 實驗發現,這種結構化方法可以讓Claude: 連續運轉數小時仍保持邏輯一致; 自動檢查自己之前寫的程式碼; 快速修復遺留bug; 有「團隊協作」的感覺。 但它仍有局限,例如: 看不到瀏覽器原生彈跳窗; 某些bug只能人工發現; 對多智能體協作的最優方式還在研究中。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。