正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月20日 09:30
RT @ShengjieWa34067: @srush_nlp 是的,在多轮强化学习实验中,我们确实看到 pass@N 随着训练步数的增加而增加。也许……