这是一个……很有意思的能力概况。 在 HLE、MMLU-Pro 等软件中,DSV3.2 之下,在智能体方面表现更佳,在 SimpleQA 上遥遥领先……而且在多模态方面,甚至与 Veo3 不相上下。 我的感觉是它体型很大,但训练不足。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月13日 08:24
这是一个……很有意思的能力概况。 在 HLE、MMLU-Pro 等软件中,DSV3.2 之下,在智能体方面表现更佳,在 SimpleQA 上遥遥领先……而且在多模态方面,甚至与 Veo3 不相上下。 我的感觉是它体型很大,但训练不足。