奇怪的是,事實並非如此。 Deep Think 是工具模式 pass@1。 我預測 Gemini 3 Pro-Heavy 的提升幅度將大於 Kimi-Thinking => Kimi Heavy(基礎更強大,Google在多智能體方面擁有更多專業知識,另一方面,未破解的問題更難/更錯誤 + 多模態)。 ≈53%。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月18日 下午5:24
奇怪的是,事實並非如此。 Deep Think 是工具模式 pass@1。 我預測 Gemini 3 Pro-Heavy 的提升幅度將大於 Kimi-Thinking => Kimi Heavy(基礎更強大,Google在多智能體方面擁有更多專業知識,另一方面,未破解的問題更難/更錯誤 + 多模態)。 ≈53%。