這是一個……很有意思的能力概況。 在 HLE、MMLU-Pro 等軟體中,DSV3.2 之下,在智能體方面表現更佳,在 SimpleQA 上遙遙領先……而且在多模態方面,甚至與 Veo3 不相上下。 我的感覺是它體型很大,但訓練不足。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月13日 上午8:24
這是一個……很有意思的能力概況。 在 HLE、MMLU-Pro 等軟體中,DSV3.2 之下,在智能體方面表現更佳,在 SimpleQA 上遙遙領先……而且在多模態方面,甚至與 Veo3 不相上下。 我的感覺是它體型很大,但訓練不足。