DeepSeek 已经将 V3 版本推向了远超 2025 年的水平。他们在推理、工具调用、定理证明等方面都取得了进步,甚至重新调整了算法的注意力机制。但进一步微调的收益已经递减。 我希望他们已经完成了 32K 集群的构建,并且能够在 12 月份发布 V4 版本。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月27日 21:33
DeepSeek 已经将 V3 版本推向了远超 2025 年的水平。他们在推理、工具调用、定理证明等方面都取得了进步,甚至重新调整了算法的注意力机制。但进一步微调的收益已经递减。 我希望他们已经完成了 32K 集群的构建,并且能够在 12 月份发布 V4 版本。