GDP (@bookwormengr): Interesting change of strategy by GLM4.7 compared to Kimi K2 Thinking…

GLM4.7 的策略變化很有意思。與 Kimi K2 Thinking、DeepSeek V3.2 和 MiniMax M2.1 相比工具調用之間穿插思考：所有這些模型都支持工具調用的交錯思考，但它們能清晰地反映前一輪的思考，如下面的第一張截圖所示。 GLM 4.7 保留的思考模式：相較之下，GLM 4.7（僅用於編碼端點）保留了先前回合的推理，如下面的螢幕截圖所示（注意紅色方塊）。對於另一個 API 端點，其行為與之前相同（丟棄前幾輪的推理）。由於模型將擁有歷史上下文信息，這肯定會提升一些性能。正如 @peakji 所建議的，模型需要了解過去的思考過程才能在後續決策中做出正確的判斷。這雖然違反了上下文壓縮的原則，但我認為在編碼場景下可能是非常值得的。我希望他們能把它做成可配置的，這樣我們就能親眼看到效果了。

來自 GDP（@bookwormengr）的推文串

作者資訊

推文串內容