Hacemos un poco de esfuerzo. Modificar la función de recompensa de demostración de velocidad de MJLAB para crear comportamientos personalizados es muy satisfactorio, ya que la función base parece aprender rapidísimo. Solo toma unos minutos empezar a ver resultados. Es muy divertido iterar. Esto fue solo 700 iters.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.