正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月21日 19:38
我们做了一些延伸工作。 修改 mjlab 速度演示奖励函数以实现自定义行为真的很有成就感,因为基础函数的学习速度似乎非常快。只需几分钟就能看到结果。迭代过程非常有趣。 这仅仅用了700次迭代。