Una prueba más de que el enfoque de entorno sintético generalista funciona: incluso con tan solo 200 mil millones de tokens se obtiene un modelo altamente versátil (quizás incluso más que Qwen para SFT).
¿Y qué lo hará aún más ajustable?: ¡el acceso a los datos de entrenamiento! Permite muchas estrategias para aprovechar el conocimiento/las puertas lógicas preexistentes.