此外,还在 17 项任务中的 2 项上取得了新的个人最佳成绩,尤其值得一提的是,在国际象棋胜者题上打破了 SOTA(此前该题似乎已达到极限),提高了 5 分以上。 没错。被 OSS-120B 打败后,Speciale 就没那么特别了。但正如我所说,它的*方法*现在才是真正的前沿。
具体来说,我认为美国边境部队在训练后的任务覆盖率方面要好得多,尤其是与这些任务类似的任务,除了两项任务之外。因此,你肯定能看出“最大化利用优势”的说法站不住脚。基础情报在这里几乎无关紧要。 @TheZvi
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年12月12日 00:49
此外,还在 17 项任务中的 2 项上取得了新的个人最佳成绩,尤其值得一提的是,在国际象棋胜者题上打破了 SOTA(此前该题似乎已达到极限),提高了 5 分以上。 没错。被 OSS-120B 打败后,Speciale 就没那么特别了。但正如我所说,它的*方法*现在才是真正的前沿。
具体来说,我认为美国边境部队在训练后的任务覆盖率方面要好得多,尤其是与这些任务类似的任务,除了两项任务之外。因此,你肯定能看出“最大化利用优势”的说法站不住脚。基础情报在这里几乎无关紧要。 @TheZvi