正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年7月31日 01:24
这似乎非常重要: 完全有可能,在给定一个精心设计的提示的情况下,一个模型无需任何强化学习就能获得IMO金奖。 我们对此一无所知,也缺乏有效搜索提示空间的工具。很高兴看到至少有人在尝试。