X (Twitter)

我觉得我之前对 Cursor 的新 Composer-1 编码语言学习模型 (LLM) 评价过低了。当然，它肯定比 GPT-5 High Effort 和 GPT-5-Codex 差，所以从这个意义上讲，在设计和实现重要的代码项目时，我并不认为它适合我的工作流程。另一方面，它的速度非常快（不知道他们是怎么做到的；他们使用的是 Groq 还是 Cerebras 硬件？是因为模型非常小巧高效吗？不确定），仅此一点就解锁了许多新的工作流程和工作技巧，适用于代码并非至关重要，或者当你开始一个新项目而不必担心破坏现有代码的情况。它也比任何版本的 GPT-5 都便宜得多。速度更快、成本更低的双重优势，使得模型的使用方式发生了质的飞跃，而我之前并没有充分意识到这一点。当迭代的成本（无论从时间还是金钱方面）都如此之低时，你就可以进行更多次的迭代。这降低了“一次性正确性”的价值；也就是说，像 GPT-5 Pro 这样的模型能够一次性正确完成复杂的编码任务而不出现任何错误（尽管即使是该模型也经常在这个非常严格的测试中失败）。但是，如果你能够闭合调试循环，快速将错误/警告反馈给模型，并且每次迭代只需 20 秒到 1 分钟（而不是像使用 GPT-5 那样投入大量精力至少需要 5 到 10 倍的时间），那么你就可以快速解决它在第一次（甚至第二次、第三次或第四次）中犯的所有低级错误，并且仍然比使用 GPT-5 更快地完成可运行的代码。如果你正在浏览器中进行开发，现在可以使用 Cursor 的全新浏览器标签页功能，真正实现完整的闭环开发。就我目前见过的所有编码工具而言，这绝对是此类功能的最佳实现（远胜于 Codex 的 Playwright MCP 或 Claude Code！）。今天我一直在使用这个提示，效果显著： “使用浏览器标签页系统地探索此应用，并以自然的方式使用界面；同时，请留意开发者控制台中的任何警告或错误。一旦发现，请开始交互式地、迭代地诊断和修复错误和问题，然后刷新应用并验证错误或警告是否已完全解决。修复问题时，请专注于确定错误的真正根本原因，而不是应用虚假的“创可贴”式修复！” 然而，这种方法真正的缺陷在于概念和规划阶段，在这个阶段你需要从宏观层面思考要做什么以及如何最好地实现它。缺乏深入思考和探索会让你一开始就走上一条难以挽回的歧途。当你的任务偏离常见编码任务的“数据流形”时，这一点就更加明显了。如果你只是在做一个简单的CRUD网站，那你可能不会太在意。但如果你尝试在人工智能生命模拟或其他类似领域开辟新天地，你就会对此深有体会。但有一种很好的混合方法，效果非常好：将最智能的规划模型与这些快速廉价的迭代模型结合起来。所以，先用浏览器应用里的 GPT-5 Pro 制定计划和初步实施方案，然后粘贴到 Cursor 里，开始迭代、修复和改进。它更擅长修改现有的坚实基础，而不是从零开始搭建基础。当你在一个全新的项目中，以轻松有趣的方式探索和尝试，而没有截止日期或预期目标时，这一切的优势就真正显现出来了。在这种情况下，速度至关重要。这让我想起了 IBM 在 20 世纪 80 年代初进行的一项关于计算机系统延迟的研究，该研究发现，当延迟低于某个神奇的水平（例如 50 毫秒）时，行为会发生很大的变化，因为人脑会感知到它正在处理一个“实时系统”。反之，即使延迟超过一个出乎意料的适中水平，比如 500 毫秒，用户参与度也会大幅下降，而且会让人感到精神疲惫和沮丧。当延迟飙升到几秒甚至更长时，人们往往会精神恍惚，难以集中注意力。看到编码模型在几秒钟内做出响应，并在不到 15 秒内快速完成 10 次编辑，这与等待 GPT-5 高努力值模型 5 分钟有条不紊地完成某项任务完全是两种不同的体验。总之，玩这个东西真的太有趣了。对我来说，它比任何电子游戏都更有趣、更吸引人。

来自 Jeffrey Emanuel（@doodlestein）的推文线程

作者信息

线程正文