我觉得这个论点很奇怪。乍一看,“行为主义强化学习”似乎不太容易滋生阴谋诡计,因为一旦被发现,就会惩罚所有导致阴谋诡计的逻辑。他们需要学会不去想这些,这就把阴谋诡计限制在无关紧要的行为上。 @Turn_Trout @QuintinPope5 @norabelrose 你们怎么看?
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月9日 06:54
我觉得这个论点很奇怪。乍一看,“行为主义强化学习”似乎不太容易滋生阴谋诡计,因为一旦被发现,就会惩罚所有导致阴谋诡计的逻辑。他们需要学会不去想这些,这就把阴谋诡计限制在无关紧要的行为上。 @Turn_Trout @QuintinPope5 @norabelrose 你们怎么看?