Nous faisons un peu d'effort. Modifier la fonction de récompense de la démo Velocity de MJLab pour implémenter des comportements personnalisés est extrêmement satisfaisant, car la fonction de base semble apprendre à une vitesse incroyable. Il suffit de quelques minutes pour commencer à voir des résultats. C'est très amusant d'itérer. Cela ne représentait que 700 itérations.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.