L'apprentissage par renforcement en une phrase : propager chaque récompense à chaque action qui y a conduit, en la dévalorisant à chaque étape.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.