X (Twitter)

claude-opus-4.5 發布囉！這次opus-4.5 把Aider polyglot coding leaderboard (我實作中覺得最準確的程式設計benchmark) 刷到了89.4! 終於要刷爆了！跟大家介紹下為什麼，年初的DeepSeek-R1 還只能完成56.9%的問題，而這次基本上能完成90%的問題了。那麼，代價是什麼？當然是各位的錢包要出血了，這玩意定價一百萬token 輸出25刀..... 我昨天給大家看的那個矽基騎手測試，運行一次基本就要1M token... 直接170塊錢進去了... 真的用不起.... 除此之外，各個其他測試也是SOTA, 稍後我會帶給大家影片實測！敬請期待！

性能參數/1

性能參數/2

定價

總結

來自 karminski-牙医（@karminski3）的推文串

作者資訊

推文串內容