(Bien sûr, il faut réserver les récompenses scalaires et binaires, et tout le tralala, aux cas où elles représentent clairement des voies de moindre résistance, mais avec de vrais utilisateurs, il y a des raisons précises pour lesquelles ils ont détesté une réponse ; le modèle doit comprendre pourquoi ils ont détesté une réponse, et non pas simplement obtenir un pouce levé ou baissé et apprendre sur de nombreux exemples.)
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.