興味深いのは、乖離があったことです。2022年には、クローズドラボがPPOを実施しており、オープンモデルは…存在していませんでした。2023年には、主にSFT(LoRAの有無にかかわらず)を実施し、その後DPO種のコピウムを取得しました。2024年のGRPOは…予想外でした。 そして、閉鎖された研究室が現在何を使用しているかはわかりません。
ところで、彼らもGRPOの成功に驚いていました
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
2 件のツイート · 2025/12/23 7:15
興味深いのは、乖離があったことです。2022年には、クローズドラボがPPOを実施しており、オープンモデルは…存在していませんでした。2023年には、主にSFT(LoRAの有無にかかわらず)を実施し、その後DPO種のコピウムを取得しました。2024年のGRPOは…予想外でした。 そして、閉鎖された研究室が現在何を使用しているかはわかりません。
ところで、彼らもGRPOの成功に驚いていました