claude-opus-4.5 發布囉! 這次opus-4.5 把Aider polyglot coding leaderboard (我實作中覺得最準確的程式設計benchmark) 刷到了89.4! 終於要刷爆了! 跟大家介紹下為什麼,年初的DeepSeek-R1 還只能完成56.9%的問題,而這次基本上能完成90%的問題了。 那麼,代價是什麼?當然是各位的錢包要出血了,這玩意定價一百萬token 輸出25刀..... 我昨天給大家看的那個矽基騎手測試,運行一次基本就要1M token... 直接170塊錢進去了... 真的用不起.... 除此之外,各個其他測試也是SOTA, 稍後我會帶給大家影片實測!敬請期待!
性能參數/1
性能參數/2
定價
總結














