X (Twitter)

正在載入線程內容

正在從 X 取得原始推文,整理成清爽的閱讀畫面。

通常只需幾秒鐘,請稍候。

meng shao (@shao__meng): Andrej Karpathy 2025 年 LLM 年终回顾:6 个“范式转变” 1. RLVR:2025 年强化学习从可验证奖励(RL… | Thread Easy