X (Twitter)

Amp 把預設模型從Gemini 3 切換到Claude Opus 4.5，實測表現：全面升級，成本意外更優快速切換的背景僅僅一周前@AmpCode 剛剛將主模型從Claude 換成了Gemini 3，這在當時被稱為"歷史性變革"。但現在他們又快速地切回Claude 的新版本Opus 4.5。原因是Gemini 3 雖然表現出色，但也暴露出明顯的缺陷——那些在內部測試時被視為"粗糙邊緣"的問題，在實際使用中給用戶帶來了非常令人沮喪的體驗，而且成本高昂。 Claude Opus 4.5 的優點· 能力表現：Opus 4.5 與Gemini 3 能力相當，雖然最高水準可能不如Gemini 3 亮眼，但更加穩定可靠，沒有明顯短板。 · 速度更快：在實際使用中響應速度更快。 · 成本效益驚人：雖然Opus 的單一token 價格較貴，但實際使用成本反而較低。原因包括： · 完成任務所需的token 更少· 犯錯更少，減少了浪費的token · 所需的人工幹預更少（提高了快取命中率，進一步降低成本和延遲）具體數據比較· 準確率：Opus 4.5（57.3%）> Gemini 3（53.7%）> Sonnet 4.5（37.1%） · 平均執行緒成本：Opus 4.5（$2.05）≈ Gemini 3（$2.04）< Sonnet 4.5（$2.75） · 失控成本佔比：Opus 4.5（2.4%）顯著低於Gemini 3（17.8%）及Sonnet 4.5（8.4%） · 速度：Sonnet 4.5（2.4分鐘）最快，Opus 4.5（3.5分鐘）比Gemini 3（4.3分鐘）快 Opus 4.5 適用場景建議· 處理長對話線程（20萬tokens 以上）時，成本優勢明顯· 當其他模型遇到能力瓶頸或頻繁出錯時· 需要處理更複雜、模糊的任務時文章地址

来自 meng shao（@shao__meng）的推文线程

作者信息

线程正文