直觉上,如果给 Zhipu 或 Moonshot 哪怕 5 万个 H200 测试用例,它们两个月内就能把 Sonnet 和 Opus 甩在后面,这似乎也合情合理。只需要再进行一些改进、推广、完善长上下文规则等等。但 Gemini Pro/GPT-5 就没那么容易了。 这些物理学博士是负担吗?
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
正在加载线程详情
正在从 X 获取原始推文,整理成清爽的阅读视图。
通常只需几秒钟,请稍候。
共 1 条推文 · 2025年11月15日 12:28
直觉上,如果给 Zhipu 或 Moonshot 哪怕 5 万个 H200 测试用例,它们两个月内就能把 Sonnet 和 Opus 甩在后面,这似乎也合情合理。只需要再进行一些改进、推广、完善长上下文规则等等。但 Gemini Pro/GPT-5 就没那么容易了。 这些物理学博士是负担吗?