這太離譜了。 V3.2-thinking,作為目前最強大的LLM之一,竟然落後於許多相對較弱的模型,甚至落後於它自身的更早版本,例如V3.1、V3.2-exp和R1-0528。這或許是lmarena被竄改的最明顯例證。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月5日 凌晨4:40
這太離譜了。 V3.2-thinking,作為目前最強大的LLM之一,竟然落後於許多相對較弱的模型,甚至落後於它自身的更早版本,例如V3.1、V3.2-exp和R1-0528。這或許是lmarena被竄改的最明顯例證。