X (Twitter)

正在加载线程详情

正在从 X 获取原始推文,整理成清爽的阅读视图。

通常只需几秒钟,请稍候。

karminski-牙医 (@karminski3): Nathan Lambert (AI2 的研究员, 基于人类反馈的强化学习(RLHF)的作者) 搞了个开放权重大模型从夯到拉排行榜,国产大… | Thread Easy