X (Twitter)

我的编程体验故事：Claude Code vs Codex CLI。为了即将到来的演示，我请 Claude Code（Sonnet 4.5）在一个提示符下生成 4 个简单的 CRUD 操作，因为我认为它们“简单且标准”。 1. 它运行了 10 分钟，生成了代码，但*没有进行自动化测试*，尽管我在 CLAUDE(dot)md 指南文件中明确要求进行测试。 2. 我让它生成测试，它在 3 分钟内完成了，但是运行 `php artisan test` 时遇到了很多问题，然后就开始兜圈子地修复它们。 3. 10 分钟后，它返回“嗯，我们遇到了一些失败，但一切都很好，这是结果”。 4. 我请 Codex（GPT-5.1-Codex）修复测试。它花了 15 分钟才完成，虽然速度很慢，但最终成功了。所有测试都通过了。要点： 1. 不要给 Sonnet 布置太大的工作范围。或者说，任何法学硕士项目都不要布置太大的工作范围。 2. Codex with GPT-5.1-Codex 比 Sonnet 慢，但更彻底。 Opus 4.5 的效果可能会更好，但价格也会更贵。下次遇到类似任务时我会尝试。

来自 Povilas Korop | Laravel Courses Creator & Youtuber（@PovilasKorop）的推文线程

作者信息

线程正文