我的编程体验故事:Claude Code vs Codex CLI。 为了即将到来的演示,我请 Claude Code(Sonnet 4.5)在一个提示符下生成 4 个简单的 CRUD 操作,因为我认为它们“简单且标准”。 1. 它运行了 10 分钟,生成了代码,但*没有进行自动化测试*,尽管我在 CLAUDE(dot)md 指南文件中明确要求进行测试。 2. 我让它生成测试,它在 3 分钟内完成了,但是运行 `php artisan test` 时遇到了很多问题,然后就开始兜圈子地修复它们。 3. 10 分钟后,它返回“嗯,我们遇到了一些失败,但一切都很好,这是结果”。 4. 我请 Codex(GPT-5.1-Codex)修复测试。它花了 15 分钟才完成,虽然速度很慢,但最终成功了。所有测试都通过了。 要点: 1. 不要给 Sonnet 布置太大的工作范围。或者说,任何法学硕士项目都不要布置太大的工作范围。 2. Codex with GPT-5.1-Codex 比 Sonnet 慢,但更彻底。 Opus 4.5 的效果可能会更好,但价格也会更贵。 下次遇到类似任务时我会尝试。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
