早在 2019 年,ARC 1 就有一个目标:将人工智能研究人员的注意力集中在实现通用性的最大瓶颈上,即即时适应新事物的能力,而这种能力在传统的深度学习范式中完全缺失。 六年之后,该领域做出了回应。通过测试时适应性训练,我们终于拥有了能够展现真正流体智力的推理模型。 虽然ARC 1目前已接近饱和,但从效率角度来看,SotA模型尚未达到人类水平。与此同时,ARC 2仍远未饱和,表明这些模型的运行能力远低于人类流体智力的上限。我们目前所达到的水平,仅相当于人类在不使用任何外部工具的情况下单次思考所能达到的水平的一小部分(而这一水平本身就远高于ARC 2的满分),因此,我们还有很长的路要走。 随着我们越来越接近通用人工智能(AGI),挑战不再局限于流体智能。新的瓶颈在于探索、目标设定和交互式规划。我们将在2026年第一季度发布ARC 3,正是为了解决这些问题。是时候开启新一轮的突破了。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。