我们在 Navi-Bench 上对 @amazon Nova Act 进行了评估。 得分:72.6% ➡️ 排名第四,位列 Navigator、Opus 和 Sonnet 之后 氛围: • 扎实的基础——几乎没有输入错误/误点击 • 擅长短期任务,但难以完成长期任务(缺乏毅力和推理能力) • 最终信息并不全面
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 2 条推文 · 2025年12月5日 16:00
我们在 Navi-Bench 上对 @amazon Nova Act 进行了评估。 得分:72.6% ➡️ 排名第四,位列 Navigator、Opus 和 Sonnet 之后 氛围: • 扎实的基础——几乎没有输入错误/误点击 • 擅长短期任务,但难以完成长期任务(缺乏毅力和推理能力) • 最终信息并不全面