X (Twitter)

Anthropic 提出了一種雙層智慧體設計解決Agent執行長任務時遺失記憶的問題隨著Claude 等AI 模型變得更強，開發者希望它們能夠：執行複雜任務（如全端開發）持續工作數小時甚至數天但每次情境視窗刷新後，AI 都會失去記憶，無法連續推進任務。這就像一個工程團隊輪班工作，但每個新工程師上崗時都完全不知道前一班做了什麼。傳統長任務執行的兩個主要失敗模式： 1、試圖一次完成所有任務（one-shot） Claude 會在一個視窗中嘗試建立整個應用，結果中途上下文耗盡，留下“半拉子工程”，下一次啟動又得重新理解。 2、過早宣告任務完成當專案部分功能完成後，Claude 有時會錯誤判斷為「任務已結束」。這兩種問題都導致任務狀態不連續、情境斷裂。為什麼這很難解決？ AI 模型的「記憶」並不是持久的。每次上下文視窗結束，它就像「重啟的電腦」一樣，什麼都不記得。雖然Anthropic 為Claude 做了「上下文壓縮（compaction）」功能，可以把對話濃縮後帶入下一輪但這還不夠，因為AI 仍然會失去結構化的專案狀態。 Anthropic 的解決方案：雙智能體架構（Two-Agent Harness）為解決這些問題，Anthropic 設計了一種新的智能體工作架構，稱為：雙智能體長運行框架它由兩類AI 角色協同完成整個任務過程： Initializer Agent（初始化智能體） Coding Agent（編碼智能體）這兩個智能體並非兩種模型，而是同一個Claude 模型在不同階段使用不同的提示模板（prompt template）運行。差別在於它們的職責分工與脈絡約束。 🧩 第一成員：Initializer Agent（初始化智能體） Initializer 的任務是：為專案建立結構化的“工作記憶” 創造清晰、永續的開發環境它只在專案第一次啟動時運行，做「專案準備」：第一次啟動時，這個智能體負責：創造整個工作環境；寫下一個初始化腳本https://t.co/VUeBdiSpyr；產生一個專案進度檔claude-progress.txt；建立Git 倉庫（用於版本管理）。 💡 它相當於專案的“開工儀式”，幫後續AI打好地基。 🧑💻 2. 編碼智能體（Coding Agent）在接下來的每一次運行中，這個智能體會：閱讀進度日誌和Git 記錄；查看「要做的功能清單」；只實現一個小功能；寫好註解、測試程式碼；保存清晰的Git 提交；更新進度日誌後退出。 💡 每次運行就像接力賽中的一棒：做一件小事、記錄清楚、交給下一位。實測結果：真的更聰明了實驗發現，這種結構化方法可以讓Claude：連續運轉數小時仍保持邏輯一致；自動檢查自己之前寫的程式碼；快速修復遺留bug；有「團隊協作」的感覺。但它仍有局限，例如：看不到瀏覽器原生彈跳窗；某些bug只能人工發現；對多智能體協作的最優方式還在研究中。

詳細介紹：xiaohu.ai/c/xiaohu-ai/an…

來自小互（@imxiaohu）的推文串

作者資訊

推文串內容