正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 2 則推文 · 2025年11月3日 下午3:40
π_RL 流程導向的視覺-語言-動作模型的線上強化學習微調
與作者討論:https://t.co/T3Sp3q594g