我认为这是强化训练,用来增强预先设定的遥控操作轨迹,但基本上没有改变什么,因为它无法推广到这栋房子以外的特定操作。我认为这主要是因为这里的操作不够严谨。 如果错误,后果很严重
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月15日 03:26
我认为这是强化训练,用来增强预先设定的遥控操作轨迹,但基本上没有改变什么,因为它无法推广到这栋房子以外的特定操作。我认为这主要是因为这里的操作不够严谨。 如果错误,后果很严重