由此可知,像 o1 这样的 LRM 在规划任务上的性能会随着计划长度的增加而下降,原因并非任务的计算复杂度增加,而是因为 LRM 需要逐步地将验证器信号编译到生成器中,而展开过程会越来越长。毕竟,在最后一个字母连接任务上,性能也会下降——而这显然是一个 O(n) 的任务! 👉
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月1日 15:12
由此可知,像 o1 这样的 LRM 在规划任务上的性能会随着计划长度的增加而下降,原因并非任务的计算复杂度增加,而是因为 LRM 需要逐步地将验证器信号编译到生成器中,而展开过程会越来越长。毕竟,在最后一个字母连接任务上,性能也会下降——而这显然是一个 O(n) 的任务! 👉