正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月22日 15:30
在最难的强化学习任务上达到了最新水平。详情稍后公布。如果没有经过深度优化的自定义内核,这个方法就毫无用处。现在正在直播中进行优化。