ジェネラリスト合成環境アプローチが機能していることのさらなる証拠: わずか 2000 億トークンでも、非常に汎用性の高いモデルが得られます (おそらく SFT の Qwen よりも多機能です)。そして、さらに微調整を可能にするのが、トレーニングデータへのアクセスです。既存の知識やロジックゲートを活用する様々な戦略が可能になります。