Preuve supplémentaire que l'approche de l'environnement synthétique généraliste fonctionne : même avec seulement 200 milliards de jetons, on obtient un modèle très polyvalent (peut-être même plus que Qwen pour SFT).
Et ce qui va permettre un réglage encore plus précis : l’accès aux données d’entraînement ! Cela ouvre la voie à de nombreuses stratégies d’exploitation des connaissances/portes logiques préexistantes.