📢Yochanites今天将在#NeurIPS2025 LAW 2025研讨会(20D宴会厅;https://t.co/xL5ZH7oYDh)上发表四篇论文——关于中间标记的语义(或sites.google.com/view/law-2025只是“徒有其名的强化学习”以及反对将中间标记拟人化的立场。 👉超越语义:无理中间标记的惊人有效性 👉徒有强化学习之名?分析LLM强化学习后训练中的结构假设 👉认知可解释推理轨迹能否提高LLM性能? 👉停止将中间思维拟人化为推理/思考的痕迹!
(其余的部分)
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年12月7日 14:35
📢Yochanites今天将在#NeurIPS2025 LAW 2025研讨会(20D宴会厅;https://t.co/xL5ZH7oYDh)上发表四篇论文——关于中间标记的语义(或sites.google.com/view/law-2025只是“徒有其名的强化学习”以及反对将中间标记拟人化的立场。 👉超越语义:无理中间标记的惊人有效性 👉徒有强化学习之名?分析LLM强化学习后训练中的结构假设 👉认知可解释推理轨迹能否提高LLM性能? 👉停止将中间思维拟人化为推理/思考的痕迹!
(其余的部分)