X (Twitter)

正在加载线程详情

正在从 X 获取原始推文，整理成清爽的阅读视图。

通常只需几秒钟，请稍候。

karminski-牙医 (@karminski3): Nathan Lambert (AI2 的研究员, 基于人类反馈的强化学习(RLHF)的作者) 搞了个开放权重大模型从夯到拉排行榜，国产大… | Thread Easy

来自 karminski-牙医（@karminski3）的推文线程