雄心壯志的規模之大令人震驚 🐳:LLM 可以證明一些非平凡定理。我們來用 PutnamBench 測試一下。我們目前最好的系統準確率是 7.4%。還有很多工作要做。 大家:💯😮 ooooO 是時候爬山了!我們「分解問題」的新思路…15%! 35%! 70%! - 🐋:夠了。 118/120,飽和度高。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年11月27日 下午5:36
雄心壯志的規模之大令人震驚 🐳:LLM 可以證明一些非平凡定理。我們來用 PutnamBench 測試一下。我們目前最好的系統準確率是 7.4%。還有很多工作要做。 大家:💯😮 ooooO 是時候爬山了!我們「分解問題」的新思路…15%! 35%! 70%! - 🐋:夠了。 118/120,飽和度高。