正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月15日 下午5:36
這也符合近期在訓練中期進行模型自適應的趨勢,這種做法大大降低了架構創新成本(本質上類似於LM物理學中的「受控實驗」)。我們或許會看到更多樣的設計。