如果人类仅仅通过函数逼近来学习,他们还能像现在这样“泛化”得这么好吗? 强大的样本高效泛化需要*推理*:在学习过程中明确地提出假设并进行检验。 你可以提升推理能力,但不能学习推理能力吗?
传统的深度强化学习(以及一般的深度学习)是通过练习来学习的。微小但稳定的局部改进,最终会积累起优秀的反应能力。 这种学习方式常常陷入错误的抽象层次。我们学习需要反思和有指导的实验,而不仅仅是练习。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年11月28日 19:42
如果人类仅仅通过函数逼近来学习,他们还能像现在这样“泛化”得这么好吗? 强大的样本高效泛化需要*推理*:在学习过程中明确地提出假设并进行检验。 你可以提升推理能力,但不能学习推理能力吗?
传统的深度强化学习(以及一般的深度学习)是通过练习来学习的。微小但稳定的局部改进,最终会积累起优秀的反应能力。 这种学习方式常常陷入错误的抽象层次。我们学习需要反思和有指导的实验,而不仅仅是练习。