独立验证过!我在日本的时候太懒了,没提交任何东西,但肯定能在误差范围内实现。我猜他们的优化方法应该没怎么变。 恭喜 Poetiq! 一些实验:
对于那些不那么懒惰、愿意花时间提交题目的人来说,如果你们把模型组合起来,Opus 可以做出一些独特的解,把分数提高到 80% 以上。强烈推荐! (不是为了获得荣誉;我在做其他相关的项目)
我没有提交集成方法,因为我觉得它不够好。它确实能更好地解决 arc-agi-2 问题,但我并不确定从中能获得什么重要的启示。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 3 条推文 · 2025年12月23日 19:37
独立验证过!我在日本的时候太懒了,没提交任何东西,但肯定能在误差范围内实现。我猜他们的优化方法应该没怎么变。 恭喜 Poetiq! 一些实验:
对于那些不那么懒惰、愿意花时间提交题目的人来说,如果你们把模型组合起来,Opus 可以做出一些独特的解,把分数提高到 80% 以上。强烈推荐! (不是为了获得荣誉;我在做其他相关的项目)
我没有提交集成方法,因为我觉得它不够好。它确实能更好地解决 arc-agi-2 问题,但我并不确定从中能获得什么重要的启示。