正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月20日 01:02
RT @srush_nlp:学术文献中有很多关于强化学习(RL)的讨论,即它使得模型在 pass@1 时表现更好,但在 pass@N 时表现更差(或者……)。