X (Twitter)

Amp はデフォルトモデルを Gemini 3 から Claude Opus 4.5 に切り替え、実際のテストでは、驚くほど低いコストで包括的なアップグレードを実現しました。この急速な切り替えは、@AmpCodeが主力モデルをClaudeからGemini 3に変更してからわずか1週間後に行われました。この変更は当時「歴史的な変化」と称賛されました。現在、彼らはClaudeの最新バージョンであるOpus 4.5に急いで切り替えています。その理由は、Gemini 3は優れたパフォーマンスを発揮する一方で、重大な欠陥も明らかになったためです。社内テストでは「粗削り」とみなされた問題が、実際の使用において非常に不満の残るユーザーエクスペリエンスをもたらし、コストも増大しました。 Claude Opus 4.5 のメリットとパフォーマンス：Opus 4.5 は、機能面では Gemini 3 に匹敵します。最高性能は Gemini 3 ほど印象的ではないかもしれませんが、明らかな弱点はなく、より安定して信頼性に優れています。 • より高速な速度: 実際の使用時の応答時間が速くなります。 • 非常に費用対効果が高い：Opusの個々のトークンは高価ですが、実際の使用コストは低くなります。その理由は以下のとおりです。 • タスク完了に必要なトークンが少なくなります。 • ミスが減り、無駄なトークンを削減します。 • 人的介入の必要性が減少（キャッシュヒット率の向上、コストとレイテンシのさらなる削減）具体的なデータの比較：精度：Opus 4.5（57.3%） > Gemini 3（53.7%） > Sonnet 4.5（37.1%） • 平均スレッドコスト: Opus 4.5 ($2.05) ≈ Gemini 3 ($2.04) < Sonnet 4.5 ($2.75) • 制御からの暴走コスト（パーセント）：Opus 4.5（2.4%）は、Gemini 3（17.8%）およびSonnet 4.5（8.4%）よりも大幅に低い。 • 速度: Sonnet 4.5 (2.4 分) が最速で、Opus 4.5 (3.5 分) は Gemini 3 (4.3 分) よりも高速です。 Opus 4.5 推奨ユースケース: • 長時間実行される対話スレッド（200,000トークン以上）を処理する場合、大幅なコスト削減効果が得られます。• 他のモデルで容量のボトルネックや頻繁なエラーが発生する場合。• より複雑で曖昧なタスクを処理する場合。記事アドレス

meng shao（@shao__meng）のスレッド

作者情報

スレッド内容