正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年12月15日 中午12:19
我也很喜歡關於推理風格/相容性的那部分。我認為對於小型模型來說,這方面還有很多尚未開發的潛力,因為注意力路徑的幾何結構需要的不僅僅是簡單的提煉。
連結:https://t.co/4JTGTyqFlU