抱歉,噪音什麼的,但是 o1-high 的性能比 o1-preview 強太多了,「最符合常識的基準測試」應該能看出這一點。 是的,這就是專有模型具有優勢的地方。 我認為這取決於我們是否擁有幾個高品質的人工編寫的資料集。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月8日 清晨7:56
抱歉,噪音什麼的,但是 o1-high 的性能比 o1-preview 強太多了,「最符合常識的基準測試」應該能看出這一點。 是的,這就是專有模型具有優勢的地方。 我認為這取決於我們是否擁有幾個高品質的人工編寫的資料集。