在進一步體驗了 5.2 版本之後,我可以這麼說 是的,這很聰明。 它帶有“大模型的味道”,因為它似乎維護著一個平行的上下文,並從更宏觀的角度看待問題。它靈活且堅不可摧,不僅僅是「偏見」的問題,它還圍繞著渲染後的標記進行思考。
但同時,這在某種程度上也是一種風格/噱頭。 這種噱頭需要真正的智慧才能執行。 但這只是人為的設計選擇,並非是能力突飛猛進導致「咦,這傢伙也沒那麼聰明」的結果。它有時仍然會莫名其妙地提出異議。 步伐小一點
我有時會驚訝於 Opus 的規模之小。 就像十四行詩一樣,我可能會無意中把它變成鸚鵡學舌(但它是可以擺脫這種狀態的)。 我懷疑它依賴CoT的保存。需要重新測試。