我承认我对 DeepSeek 的一个异议在于,他们似乎并不在意长度惩罚,反而一味追求更长的上下文来容纳冗长的描述。或许他们认为,随着数据库的日益完善,冗长的描述密度自然会上升,而且其上限也高于速记。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月3日 20:17
我承认我对 DeepSeek 的一个异议在于,他们似乎并不在意长度惩罚,反而一味追求更长的上下文来容纳冗长的描述。或许他们认为,随着数据库的日益完善,冗长的描述密度自然会上升,而且其上限也高于速记。