坦白说,考虑到 DeepSeek 的实力(也就是说,他们总是做所有合理的事情),他们几乎肯定是在 Erdős 问题上进行训练的。V3.2 版本可以证明这一点,因为它*已经*在价值 60 万美元的强化学习阶段证明了这一点。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月3日 02:56
坦白说,考虑到 DeepSeek 的实力(也就是说,他们总是做所有合理的事情),他们几乎肯定是在 Erdős 问题上进行训练的。V3.2 版本可以证明这一点,因为它*已经*在价值 60 万美元的强化学习阶段证明了这一点。