(obviamente, mantenga las recompensas escalares y binarias y todo ese jazz para cuando sean claramente caminos de menor resistencia, pero con usuarios reales tienen razones exactas por las que odiaron una respuesta: el modelo necesita entender por qué odiaron una respuesta, no solo obtener un visto bueno o no y aprender sobre muchas muestras)
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.