如果你翻閱我之前隨口提出的關於2024-2025年基準的想法/建議,就能重現這個問題。最後一點提示,這可不是那種在經過調整的GRPO面前不堪一擊的、故弄玄虛的所謂「硬推理」理論。 但我已經遊走在危險的邊緣了。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月24日 凌晨2:56
如果你翻閱我之前隨口提出的關於2024-2025年基準的想法/建議,就能重現這個問題。最後一點提示,這可不是那種在經過調整的GRPO面前不堪一擊的、故弄玄虛的所謂「硬推理」理論。 但我已經遊走在危險的邊緣了。