直覺上,如果給 Zhipu 或 Moonshot 哪怕 5 萬個 H200 測試用例,它們兩個月內就能把 Sonnet 和 Opus 甩在後面,這似乎也合情合理。只需要再進行一些改進、推廣、完善長上下文規則等等。但 Gemini Pro/GPT-5 就沒那麼容易了。 這些物理學博士是負擔嗎?
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月15日 中午12:28
直覺上,如果給 Zhipu 或 Moonshot 哪怕 5 萬個 H200 測試用例,它們兩個月內就能把 Sonnet 和 Opus 甩在後面,這似乎也合情合理。只需要再進行一些改進、推廣、完善長上下文規則等等。但 Gemini Pro/GPT-5 就沒那麼容易了。 這些物理學博士是負擔嗎?