X (Twitter)

我的程式體驗故事：Claude Code vs Codex CLI。為了即將到來的演示，我請 Claude Code（Sonnet 4.5）在一個提示符下生成 4 個簡單的 CRUD 操作，因為我認為它們「簡單且標準」。 1. 它運行了 10 分鐘並產生了程式碼，*但沒有進行自動化測試*，儘管我在 CLAUDE(dot)md 指南文件中明確要求進行測試。 2. 我讓它產生測試，它在 3 分鐘內完成了，但是運行 `php artisan test` 時遇到了很多問題，然後就開始兜圈子地修復它們。 3. 10 分鐘後，它返回“嗯，我們遇到了一些失敗，但一切都很好，這是結果”。 4. 我請 Codex（GPT-5.1-Codex）修復測試。它花了 15 分鐘才完成，雖然速度很慢，但最終成功了。所有測試都通過了。要點： 1. 不要給 Sonnet 太大的工作範圍。或者說，任何法學碩士課程都不要佈置太大的工作範圍。 2. Codex with GPT-5.1-Codex 比 Sonnet 慢，但更徹底。 Opus 4.5 的效果可能會更好，但價格也會更高。下次遇到類似任務時我會嘗試。

來自 Povilas Korop | Laravel Courses Creator & Youtuber（@PovilasKorop）的推文串

作者資訊

推文串內容