GLM4.7 的策略變化很有意思。 與 Kimi K2 Thinking、DeepSeek V3.2 和 MiniMax M2.1 相比 工具調用之間穿插思考: 所有這些模型都支持工具調用的交錯思考,但它們能清晰地反映前一輪的思考,如下面的第一張截圖所示。 GLM 4.7 保留的思考模式: 相較之下,GLM 4.7(僅用於編碼端點)保留了先前回合的推理,如下面的螢幕截圖所示(注意紅色方塊)。 對於另一個 API 端點,其行為與之前相同(丟棄前幾輪的推理)。 由於模型將擁有歷史上下文信息,這肯定會提升一些性能。 正如 @peakji 所建議的,模型需要了解過去的思考過程才能在後續決策中做出正確的判斷。這雖然違反了上下文壓縮的原則,但我認為在編碼場景下可能是非常值得的。 我希望他們能把它做成可配置的,這樣我們就能親眼看到效果了。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。

