スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
2 件のツイート · 2025/11/07 16:47
セイルRL 二重報酬強化学習チューニングによるMLLMの思考タイミングと思考方法の指導
著者と議論する: https://t.co/hSUtZgz29t