LogoThread Easy
  • 탐색
  • 스레드 작성
LogoThread Easy

트위터 스레드의 올인원 파트너

© 2025 Thread Easy All Rights Reserved.

탐색

Newest first — browse tweet threads

Keep on to blur preview images; turn off to show them clearly

Anthropic 提出了一种双层智能体设计 

解决Agent执行长任务时丢失记忆的问题

随着 Claude 等 AI 模型变得更强,开发者希望它们能够:

执行复杂任务(如全栈开发)
持续工作数小时甚至数天

但每次上下文窗口刷新后,AI 都会丢失记忆,无法连续推进任务。

这就像一个工程团队轮班工作,但每个新工程师上岗时都完全不知道前一班干了什么。

传统长任务执行的两个主要失败模式:

1、试图一次性完成所有任务(one-shot)

Claude 会在一个窗口中尝试构建整个应用,结果中途上下文耗尽,留下“半拉子工程”,下一次启动又得重新理解。

2、过早宣告任务完成

当项目部分功能完成后,Claude 有时会错误判断为“任务已结束”。

这两种问题都导致 任务状态不连续、上下文断裂。

为什么这很难解决?

AI 模型的“记忆”不是持久的。

每次上下文窗口结束,它就像“重启的电脑”一样,什么都不记得。

虽然 Anthropic 给 Claude 做了 “上下文压缩(compaction)” 功能,可以把对话浓缩后带入下一轮

但这还不够,因为 AI 仍然会丢掉结构化的项目状态。

Anthropic 的解决方案:双智能体架构(Two-Agent Harness)

为解决这些问题,Anthropic 设计了一种新的智能体工作架构,称为:

双智能体长运行框架

它由两类 AI 角色协同完成整个任务过程:

Initializer Agent(初始化智能体)
Coding Agent(编码智能体)

这两个智能体并非两种模型,而是同一个 Claude 模型在不同阶段使用不同的提示模板(prompt template)运行。

区别在于它们的职责分工与上下文约束。

🧩 第一位成员:Initializer Agent(初始化智能体)

Initializer 的任务是:

为项目建立结构化的“工作记忆”
创建清晰、可持续的开发环境

它只在项目第一次启动时运行,做“项目准备”:

第一次启动时,这个智能体负责:

创建整个工作环境;
写下一个初始化脚本 https://t.co/VUeBdiSpyr;
生成一个项目进度文件 claude-progress.txt;
建立 Git 仓库(用于版本管理)。

💡 它相当于项目的“开工仪式”,帮后续AI打好地基。

🧑💻 2. 编码智能体(Coding Agent)

接下来的每一次运行中,这个智能体会:

阅读进度日志和 Git 记录;
查看“要做的功能列表”;
只实现一个小功能;
写好注释、测试代码;
保存清晰的 Git 提交;
更新进度日志后退出。

💡 每次运行就像接力赛中的一棒:干一件小事、记录清楚、交给下一位。

实测结果:真的更聪明了

实验发现,这种结构化方法可以让 Claude:

连续运行数小时仍保持逻辑一致;
自动检查自己之前写的代码;
快速修复遗留bug;
有“团队协作”的感觉。

但它仍有局限,比如:

看不到浏览器原生弹窗;
某些bug只能人工发现;
对多智能体协作的最优方式还在研究中。

Anthropic 提出了一种双层智能体设计 解决Agent执行长任务时丢失记忆的问题 随着 Claude 等 AI 模型变得更强,开发者希望它们能够: 执行复杂任务(如全栈开发) 持续工作数小时甚至数天 但每次上下文窗口刷新后,AI 都会丢失记忆,无法连续推进任务。 这就像一个工程团队轮班工作,但每个新工程师上岗时都完全不知道前一班干了什么。 传统长任务执行的两个主要失败模式: 1、试图一次性完成所有任务(one-shot) Claude 会在一个窗口中尝试构建整个应用,结果中途上下文耗尽,留下“半拉子工程”,下一次启动又得重新理解。 2、过早宣告任务完成 当项目部分功能完成后,Claude 有时会错误判断为“任务已结束”。 这两种问题都导致 任务状态不连续、上下文断裂。 为什么这很难解决? AI 模型的“记忆”不是持久的。 每次上下文窗口结束,它就像“重启的电脑”一样,什么都不记得。 虽然 Anthropic 给 Claude 做了 “上下文压缩(compaction)” 功能,可以把对话浓缩后带入下一轮 但这还不够,因为 AI 仍然会丢掉结构化的项目状态。 Anthropic 的解决方案:双智能体架构(Two-Agent Harness) 为解决这些问题,Anthropic 设计了一种新的智能体工作架构,称为: 双智能体长运行框架 它由两类 AI 角色协同完成整个任务过程: Initializer Agent(初始化智能体) Coding Agent(编码智能体) 这两个智能体并非两种模型,而是同一个 Claude 模型在不同阶段使用不同的提示模板(prompt template)运行。 区别在于它们的职责分工与上下文约束。 🧩 第一位成员:Initializer Agent(初始化智能体) Initializer 的任务是: 为项目建立结构化的“工作记忆” 创建清晰、可持续的开发环境 它只在项目第一次启动时运行,做“项目准备”: 第一次启动时,这个智能体负责: 创建整个工作环境; 写下一个初始化脚本 https://t.co/VUeBdiSpyr; 生成一个项目进度文件 claude-progress.txt; 建立 Git 仓库(用于版本管理)。 💡 它相当于项目的“开工仪式”,帮后续AI打好地基。 🧑💻 2. 编码智能体(Coding Agent) 接下来的每一次运行中,这个智能体会: 阅读进度日志和 Git 记录; 查看“要做的功能列表”; 只实现一个小功能; 写好注释、测试代码; 保存清晰的 Git 提交; 更新进度日志后退出。 💡 每次运行就像接力赛中的一棒:干一件小事、记录清楚、交给下一位。 实测结果:真的更聪明了 实验发现,这种结构化方法可以让 Claude: 连续运行数小时仍保持逻辑一致; 自动检查自己之前写的代码; 快速修复遗留bug; 有“团队协作”的感觉。 但它仍有局限,比如: 看不到浏览器原生弹窗; 某些bug只能人工发现; 对多智能体协作的最优方式还在研究中。

详细介绍:https://t.co/TiCZJwTO1F

avatar for 小互
小互
Thu Nov 27 07:11:45
RT @indie_maker_fox: MkDollar上可以做的东西可太多了!

网站还没有正式上线,别注册体验,上线前会删库

使用MkSaaS进行vibe coding,这个体验是真的爽啊

RT @indie_maker_fox: MkDollar上可以做的东西可太多了! 网站还没有正式上线,别注册体验,上线前会删库 使用MkSaaS进行vibe coding,这个体验是真的爽啊

🔥 The best AI SaaS boilerplate - https://t.co/VyNtTs0jSX 🚀 The best directory boilerplate with AI - https://t.co/wEvJ1Dd8aR 🎉 https://t.co/bh1RxeERuY & https://t.co/zubXJCoY92 & https://t.co/tfQf8T7gGF

avatar for Fox@MkSaaS.com
Fox@MkSaaS.com
Thu Nov 27 07:10:42
RT @yanda: It was a pleasure to be on Founders & Builders with my friend & @wandb colleague @Joewearofficial. We cover a broad range: follo…

RT @yanda: It was a pleasure to be on Founders & Builders with my friend & @wandb colleague @Joewearofficial. We cover a broad range: follo…

@axiommathai : careers@axiommath.ai

avatar for Carina Hong
Carina Hong
Thu Nov 27 07:09:11
🍌 Nano Banana 一致性就是生产力啊!
绝了,这是一致性的绝妙 idea —— X-Ray (见视频)

有了想法,先把 https://t.co/Cexnm00Ayi 里面先构建原型
然后下载 zip 包拖进 Cursor 改造一下
即刻上线 https://t.co/YKQnKb6N8q

Kudos to @lucas__crespo

🍌 Nano Banana 一致性就是生产力啊! 绝了,这是一致性的绝妙 idea —— X-Ray (见视频) 有了想法,先把 https://t.co/Cexnm00Ayi 里面先构建原型 然后下载 zip 包拖进 Cursor 改造一下 即刻上线 https://t.co/YKQnKb6N8q Kudos to @lucas__crespo

🚧 building https://t.co/AJfZ3LMlgq https://t.co/606cFUoda3 https://t.co/s0m0tpQMDH https://t.co/UQ5vrrYdAG 🐣learning/earning while helping others ❤️making software, storytelling videos 🔙alibaba @thoughtworks

avatar for 吕立青_JimmyLv (闭关ing) 2𐃏25
吕立青_JimmyLv (闭关ing) 2𐃏25
Thu Nov 27 07:08:11
Typical FT exercise in how many different ways you can paraphrase «unverified rumors»
But it makes sense. Not so much the Huawei angle (though obviously Wenfeng wants domestic compute, that's 1/4 of the argument for the effort) but that they want physical control of their cluster

Typical FT exercise in how many different ways you can paraphrase «unverified rumors» But it makes sense. Not so much the Huawei angle (though obviously Wenfeng wants domestic compute, that's 1/4 of the argument for the effort) but that they want physical control of their cluster

We're in a race. It's not USA vs China but humans and AGIs vs ape power centralization. @deepseek_ai stan #1, 2023–Deep Time «C’est la guerre.» ®1

avatar for Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Thu Nov 27 07:04:53
New blogpost✍️ Don’t be a scary old guy: My 40s survival strategy with charm
⦿ “You’ve got presence” just means “You look older now.”
⦿ Make a smile. A grumpy middle-aged guy is just scary
⦿ Be humble. The more achievements you stack, the more people shrink back
⦿ Use the charm of contrast

New blogpost✍️ Don’t be a scary old guy: My 40s survival strategy with charm ⦿ “You’ve got presence” just means “You look older now.” ⦿ Make a smile. A grumpy middle-aged guy is just scary ⦿ Be humble. The more achievements you stack, the more people shrink back ⦿ Use the charm of contrast

Read article: https://t.co/XZI1QNyiv6

avatar for Takuya 🐾 devaslife
Takuya 🐾 devaslife
Thu Nov 27 06:55:30
  • Previous
  • 1
  • More pages
  • 2225
  • 2226
  • 2227
  • More pages
  • 5634
  • Next