正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月17日 21:26
梯度下降法是优化空间的一种强大工具,它验证了流形假设,但推理空间是离散的、组合的。 GD 在悬崖状地形中失效,因为一个离散的变化(一个逻辑步骤)会改变整个结果。 除非...???