これは、10億トークンを処理した後の、1900万パラメータ モデルの別のバージョンです。私のColabクレジットをほぼ使い果たしました。十分な計算能力があれば、わずか数時間で完全にトレーニングできます。