X (Twitter)

学习自然语言规则之所以在实践中如此有效，其原因（以及何时有效）实际上在于了解意图和偏好。核心规范通常最容易用英语描述。但大量的边缘案例和故障模式通常最容易（也最自然地）通过示例或反馈以分布式的方式表达。但我们该如何将这些转化为政策呢？对于低层次的机械或运动技能，梯度更新几乎无可匹敌。而对于高层次的操控或涌现/潜在需求，快速学习则几乎无可匹敌。这就是为什么在人工智能软件中，你需要这三者：自然语言签名、数据驱动的评估/反馈和符号组合，才能完整地*指定*你的系统。然后，你需要这三者：快速优化、梯度更新和推理时缩放，以最大限度地*调整*你的系统。

如果你认为人工智能软件中的学习就是拟合数据集，那么这种细微差别就完全被忽略了。单凭评估结果（或者单凭程序本身）会大大低估问题的严重性。

来自 Omar Khattab（@lateinteraction）的推文线程

作者信息

线程正文