X (Twitter)

我覺得我之前對 Cursor 的新 Composer-1 編碼語言學習模型 (LLM) 評價過低了。當然，它肯定比 GPT-5 High Effort 和 GPT-5-Codex 差，所以從這個意義上講，在設計和實現重要的程式碼專案時，我並不認為它適合我的工作流程。另一方面，它的速度非常快（不知道他們是怎麼做到的；他們使用的是 Groq 還是 Cerebras 硬體？是因為模型非常小巧高效嗎？不確定），僅此一點就解鎖了許多新的工作流程和工作技巧，適用於代碼並非至關重要，或者當你開始一個新項目而不必擔心破壞現有代碼的情況。它也比任何版本的 GPT-5 便宜得多。速度更快、成本更低的雙重優勢，使得模型的使用方式發生了質的飛躍，而我之前並沒有充分意識到這一點。當迭代的成本（無論從時間或金錢方面）都如此之低時，你就可以進行更多的迭代。這降低了「一次性正確性」的價值；也就是說，像 GPT-5 Pro 這樣的模型能夠一次性正確完成複雜的編碼任務而不出現任何錯誤（儘管即使是該模型也經常在這個非常嚴格的測試中失敗）。但是，如果你能夠閉合調試循環，快速將錯誤/警告反饋給模型，並且每次迭代只需 20 秒到 1 分鐘（而不是像使用 GPT-5 那樣投入大量精力至少需要 5 到 10 倍的時間），那麼你就可以快速解決它在第一次（甚至第二次、第三次或第四次錯誤）中犯的所有低級錯誤，並且仍然比可完成的 GPT-5 低級錯誤。如果你正在瀏覽器中進行開發，現在可以使用 Cursor 的全新瀏覽器標籤頁功能，真正實現完整的閉環開發。就我目前見過的所有編碼工具而言，這絕對是此類功能的最佳實現（遠勝於 Codex 的 Playwright MCP 或 Claude Code！）。今天我一直在使用這個提示，效果顯著：「使用瀏覽器標籤頁系統地探索此應用程式，並以自然的方式使用介面；同時，請留意開發者控制台中的任何警告或錯誤。一旦發現，請開始互動式地、迭代地診斷和修復錯誤和問題，然後刷新應用程式並驗證錯誤或警告是否已完全解決。修復問題時，請專注於確定錯誤的真正根本原因，而不是應用虛假的「創可貼式修復」！然而，這種方法真正的缺陷在於概念和規劃階段，在這個階段你需要從宏觀層面思考要做什麼以及如何最好地實現它。缺乏深入思考和探索會讓你一開始就走上一條難以挽回的歧途。當你的任務偏離常見編碼任務的「資料流形」時，這一點就更加明顯了。如果你只是在做一個簡單的CRUD網站，那你可能不會太在意。但如果你嘗試在人工智慧生命模擬或其他類似領域開闢新天地，你就會對此深有體會。但有一個很好的混合方法，效果非常好：將最聰明的規劃模型與這些快速且廉價的迭代模型結合。所以，先用瀏覽器應用程式裡的 GPT-5 Pro 制定計畫和初步實施方案，然後貼到 Cursor 裡，開始迭代、修復和改進。它更擅長修改現有的堅實基礎，而不是從零開始建立基礎。當你在一個全新的專案中，以輕鬆有趣的方式探索和嘗試，而沒有截止日期或預期目標時，這一切的優勢就真正顯現出來了。在這種情況下，速度至關重要。這讓我想起了 IBM 在 20 世紀 80 年代初進行的一項關於電腦系統延遲的研究，該研究發現，當延遲低於某個神奇的水平（例如 50 毫秒）時，行為會發生很大的變化，因為人腦會感知到它正在處理一個「即時系統」。反之，即使延遲超過一個出乎意料的適中水平，例如 500 毫秒，用戶參與度也會大幅下降，而且會讓人感到精神疲憊和沮喪。當延遲飆升到幾秒鐘甚至更長時，人們往往會精神恍惚，難以集中註意力。看到編碼模型在幾秒鐘內做出回應，並在不到 15 秒內快速完成 10 次編輯，這與等待 GPT-5 高努力值模型 5 分鐘有條不紊地完成某項任務完全是兩種不同的體驗。總之，玩這個東西真的太有趣了。對我來說，它比任何電子遊戲都更有趣、更吸引人。

來自 Jeffrey Emanuel（@doodlestein）的推文串

作者資訊

推文串內容