RT @scaling01:Claude 4.5 Opus 在另一项编码基准测试中占据主导地位 AutoCodeBench-V2 由 1000 个经过精心挑选和迭代改进的问题组成……
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年12月4日 18:58
RT @scaling01:Claude 4.5 Opus 在另一项编码基准测试中占据主导地位 AutoCodeBench-V2 由 1000 个经过精心挑选和迭代改进的问题组成……