對於那些好奇的人來說,不出所料,Gemini 3 Deep Think 解決了困擾我好幾天的堆疊下溢錯誤。它的答案比 Opus 4.5 更明確,Opus 4.5 是唯一另一個公開解決此問題的模型(即使是 Gemini 3 Pro 也未能解決)。它甚至能準確地指出錯誤發生的確切位置。不過,它確實耗時太長了… 我目前沒有更難的測試,大部分基準測試都已經飽和了,而且我正忙於SupGen的相關工作,所以關於這個測試我就說這麼多吧。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
