L'apprentissage par renforcement est un tout autre monde. Les 9 meilleurs modèles linéaires logiques totalisent 2,4 T de tokens, soit environ 10 To. PufferLib entraîne plus de 1 000 To d'observations sur une seule tinybox 6x4090. On consacre tellement d'efforts à la mise à l'échelle du calcul, et si peu à celle des données !
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.