#5 - Comment calculer votre MFU ? Liengithub.com/karpathy/nanoc…ire Une discussion intéressante sur nanochat par @TheZachMueller
#6 - Votre framework RL efficace vous apporte secrètement une formation RL hors stratégie Lien : hfengyao.notion.site/off-policy-rl#… Un blog vraiment intéressant sur la compréhension du décalage entre l'entraînement et l'inférence et son impact sur les résultats. « Votre infrastructure fausse les calculs. Voici pourquoi, à quel point c'est grave et comment y remédier grâce à l'échantillonnage d'importance. »

