La gente me dice que, a menos que tengas GPU y escribas kernels, Tinker hace que el entrenamiento posterior sea mucho más económico. También es una API deliciosamente abstracta. antorcha: • y = modelo.adelante(x) • L = función_pérdida(y) • L.atrás() tinker/torchtitan: • pérdida = modelo.adelante_atrás(x)
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.