私のバイブコーディングストーリー: Claude Code vs Codex CLI。 今後のデモでは、Claude Code (Sonnet 4.5) に、1 つのプロンプトで 4 つのシンプルな CRUD を生成するように依頼しました。これは、「簡単で標準的」だと思ったからです。 1. CLAUDE(dot)md ガイドライン ファイルではテストが具体的に要求されているにもかかわらず、10 分間動作し、*自動テストなしで*コードを生成しました。 2. テストを生成するように指示したところ、3 分で生成されましたが、`php artisan test` を実行すると多くの問題が発生し、それらを修正するためにぐるぐる回り始めました。 3. さらに 10 分後、「いや、失敗はありますが、まだすべて順調です。これが結果です」というメッセージが返されました。 4. Codex (GPT-5.1-Codex) にテストの修正を依頼しました。15分ほど動作は遅かったものの、期待通りの動作をしました。テストはすべてグリーンでした。 まとめ: 1. Sonnetに、あるいは他のLLMに、あまり大きな仕事を与えないでください。 2. GPT-5.1 を使用した Codex - Codex は Sonnet よりも遅いですが、はるかに徹底的です。 おそらく Opus 4.5 の方が優れているでしょうが、より高価になるでしょう。 次回同様のタスクが発生したときに試してみます。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
