Nous ignorons complètement le formalisme MDP avec Puffer. Il est totalement inutile. L'apprentissage par renforcement est une science purement empirique dont les progrès reposent principalement sur l'ingénierie des performances.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.