X (Twitter)

正在加载线程详情

正在从 X 获取原始推文，整理成清爽的阅读视图。

通常只需几秒钟，请稍候。

AK (@_akhaliq): SAIL-RL Guiding MLLMs in When and How to Think via Dual-Reward RL Tun… | Thread Easy

来自 AK（@_akhaliq）的推文线程