Cortex-AGI 的结果(通过程序生成在运行时创建独特的谜题实例,因此是衡量推理能力的一个相当不错的指标)。复杂度呈指数级增长,因此 38% <<< 41%。 不过,Speciale 仍然处于领先地位。但 Grok 4.1 的效率也毫不逊色。至于 GPT……
cortex-agi.com/?tab=methodolo…
钱币
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 3 条推文 · 2025年12月6日 17:05
Cortex-AGI 的结果(通过程序生成在运行时创建独特的谜题实例,因此是衡量推理能力的一个相当不错的指标)。复杂度呈指数级增长,因此 38% <<< 41%。 不过,Speciale 仍然处于领先地位。但 Grok 4.1 的效率也毫不逊色。至于 GPT……
cortex-agi.com/?tab=methodolo…
钱币