X (Twitter)

正在加载线程详情

正在从 X 获取原始推文,整理成清爽的阅读视图。

通常只需几秒钟,请稍候。

meng shao (@shao__meng): Andrej Karpathy 2025 年 LLM 年终回顾:6 个“范式转变” 1. RLVR:2025 年强化学习从可验证奖励(RL… | Thread Easy