Amp 把預設模型從Gemini 3 切換到Claude Opus 4.5,實測表現:全面升級,成本意外更優 快速切換的背景僅僅一周前@AmpCode 剛剛將主模型從Claude 換成了Gemini 3,這在當時被稱為"歷史性變革"。但現在他們又快速地切回Claude 的新版本Opus 4.5。原因是Gemini 3 雖然表現出色,但也暴露出明顯的缺陷——那些在內部測試時被視為"粗糙邊緣"的問題,在實際使用中給用戶帶來了非常令人沮喪的體驗,而且成本高昂。 Claude Opus 4.5 的優點· 能力表現:Opus 4.5 與Gemini 3 能力相當,雖然最高水準可能不如Gemini 3 亮眼,但更加穩定可靠,沒有明顯短板。 · 速度更快:在實際使用中響應速度更快。 · 成本效益驚人:雖然Opus 的單一token 價格較貴,但實際使用成本反而較低。原因包括: · 完成任務所需的token 更少· 犯錯更少,減少了浪費的token · 所需的人工幹預更少(提高了快取命中率,進一步降低成本和延遲) 具體數據比較· 準確率:Opus 4.5(57.3%)> Gemini 3(53.7%)> Sonnet 4.5(37.1%) · 平均執行緒成本:Opus 4.5($2.05)≈ Gemini 3($2.04)< Sonnet 4.5($2.75) · 失控成本佔比:Opus 4.5(2.4%)顯著低於Gemini 3(17.8%)及Sonnet 4.5(8.4%) · 速度:Sonnet 4.5(2.4分鐘)最快,Opus 4.5(3.5分鐘)比Gemini 3(4.3分鐘)快 Opus 4.5 適用場景建議· 處理長對話線程(20萬tokens 以上)時,成本優勢明顯· 當其他模型遇到能力瓶頸或頻繁出錯時· 需要處理更複雜、模糊的任務時 文章地址
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
