学习自然语言规则之所以在实践中如此有效,其原因(以及何时有效)实际上在于了解意图和偏好。 核心规范通常最容易用英语描述。但大量的边缘案例和故障模式通常最容易(也最自然地)通过示例或反馈以分布式的方式表达。 但我们该如何将这些转化为政策呢?对于低层次的机械或运动技能,梯度更新几乎无可匹敌。而对于高层次的操控或涌现/潜在需求,快速学习则几乎无可匹敌。 这就是为什么在人工智能软件中,你需要这三者:自然语言签名、数据驱动的评估/反馈和符号组合,才能完整地*指定*你的系统。 然后,你需要这三者:快速优化、梯度更新和推理时缩放,以最大限度地*调整*你的系统。
如果你认为人工智能软件中的学习就是拟合数据集,那么这种细微差别就完全被忽略了。单凭评估结果(或者单凭程序本身)会大大低估问题的严重性。