Jugando con la función de suavizado de gráficos en WandB para que parezca que la recompensa aumenta más de lo que realmente aumenta, solo para volver a sentir algo.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.