在进一步体验了 5.2 版本之后,我可以这么说 是的,这很聪明。 它带有“大模型的味道”,因为它似乎维护着一个平行的上下文,并从更宏观的角度看待问题。它灵活且坚不可摧,不仅仅是“偏见”的问题,它还围绕着渲染后的标记进行思考。
但同时,这在某种程度上也是一种风格/噱头。 这种噱头需要真正的智慧才能执行。 但这只是人为的设计选择,并非是能力突飞猛进导致“咦,这家伙也没那么聪明”的结果。它有时仍然会莫名其妙地提出异议。 步子小一点
我有时会惊讶于 Opus 的规模之小。 就像十四行诗一样,我可能会无意中把它变成鹦鹉学舌(但它是可以摆脱这种状态的)。 我怀疑它依赖于CoT的保存。需要重新测试。