X (Twitter)

正在載入線程內容

正在從 X 取得原始推文,整理成清爽的閱讀畫面。

通常只需幾秒鐘,請稍候。

AK (@_akhaliq): SAIL-RL Guiding MLLMs in When and How to Think via Dual-Reward RL Tun… | Thread Easy