dsv3.2 特别版比其他任何型号都更胜一筹 在 4/8 的评估中,V3.2-Speciale 的思考能力比 Kimi-K2-Thinking 低。在 3/3 的评估中,则高;Codeforces 没有 Kimi 的数据点。 一个比之前大7个月、体型小33%、注意力受损的AdamW检查点,被彻底放开手脚,碾压了K2。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月1日 12:51
dsv3.2 特别版比其他任何型号都更胜一筹 在 4/8 的评估中,V3.2-Speciale 的思考能力比 Kimi-K2-Thinking 低。在 3/3 的评估中,则高;Codeforces 没有 Kimi 的数据点。 一个比之前大7个月、体型小33%、注意力受损的AdamW检查点,被彻底放开手脚,碾压了K2。