Amp はデフォルト モデルを Gemini 3 から Claude Opus 4.5 に切り替え、実際のテストでは、驚くほど低いコストで包括的なアップグレードを実現しました。 この急速な切り替えは、@AmpCodeが主力モデルをClaudeからGemini 3に変更してからわずか1週間後に行われました。この変更は当時「歴史的な変化」と称賛されました。現在、彼らはClaudeの最新バージョンであるOpus 4.5に急いで切り替えています。その理由は、Gemini 3は優れたパフォーマンスを発揮する一方で、重大な欠陥も明らかになったためです。社内テストでは「粗削り」とみなされた問題が、実際の使用において非常に不満の残るユーザーエクスペリエンスをもたらし、コストも増大しました。 Claude Opus 4.5 のメリットとパフォーマンス:Opus 4.5 は、機能面では Gemini 3 に匹敵します。最高性能は Gemini 3 ほど印象的ではないかもしれませんが、明らかな弱点はなく、より安定して信頼性に優れています。 • より高速な速度: 実際の使用時の応答時間が速くなります。 • 非常に費用対効果が高い:Opusの個々のトークンは高価ですが、実際の使用コストは低くなります。その理由は以下のとおりです。 • タスク完了に必要なトークンが少なくなります。 • ミスが減り、無駄なトークンを削減します。 • 人的介入の必要性が減少(キャッシュヒット率の向上、コストとレイテンシのさらなる削減) 具体的なデータの比較:精度:Opus 4.5(57.3%) > Gemini 3(53.7%) > Sonnet 4.5(37.1%) • 平均スレッドコスト: Opus 4.5 ($2.05) ≈ Gemini 3 ($2.04) < Sonnet 4.5 ($2.75) • 制御からの暴走コスト(パーセント):Opus 4.5(2.4%)は、Gemini 3(17.8%)およびSonnet 4.5(8.4%)よりも大幅に低い。 • 速度: Sonnet 4.5 (2.4 分) が最速で、Opus 4.5 (3.5 分) は Gemini 3 (4.3 分) よりも高速です。 Opus 4.5 推奨ユースケース: • 長時間実行される対話スレッド(200,000トークン以上)を処理する場合、大幅なコスト削減効果が得られます。• 他のモデルで容量のボトルネックや頻繁なエラーが発生する場合。• より複雑で曖昧なタスクを処理する場合。 記事アドレス
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
