正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
共 1 則推文 · 2025年12月6日 晚上8:14
既然透過添加強化學習(RL)已經使 LLM 的效率大幅降低,下一步就是使它們具有貝葉斯性。