我的程式體驗故事:Claude Code vs Codex CLI。 為了即將到來的演示,我請 Claude Code(Sonnet 4.5)在一個提示符下生成 4 個簡單的 CRUD 操作,因為我認為它們「簡單且標準」。 1. 它運行了 10 分鐘並產生了程式碼,*但沒有進行自動化測試*,儘管我在 CLAUDE(dot)md 指南文件中明確要求進行測試。 2. 我讓它產生測試,它在 3 分鐘內完成了,但是運行 `php artisan test` 時遇到了很多問題,然後就開始兜圈子地修復它們。 3. 10 分鐘後,它返回“嗯,我們遇到了一些失敗,但一切都很好,這是結果”。 4. 我請 Codex(GPT-5.1-Codex)修復測試。它花了 15 分鐘才完成,雖然速度很慢,但最終成功了。所有測試都通過了。 要點: 1. 不要給 Sonnet 太大的工作範圍。或者說,任何法學碩士課程都不要佈置太大的工作範圍。 2. Codex with GPT-5.1-Codex 比 Sonnet 慢,但更徹底。 Opus 4.5 的效果可能會更好,但價格也會更高。 下次遇到類似任務時我會嘗試。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
