#5 - ¿Cómo calcular tu MFU? enlace - hgithub.com/karpathy/nanoc… Una interesante charla sobre nanochat por @TheZachMueller
#6 - Tu eficiente marco de aprendizaje por refuerzo te proporciona secretamente entrenamiento de aprfengyao.notion.site/off-policy-rl#…uera de las políticas Enlace: https://t.co/d2Loq5UwZQ Un blog muy bueno sobre cómo entender la discrepancia entre entrenamiento e inferencia y cómo afecta a los resultados. “Tu infraestructura está causando problemas matemáticos. Aquí te explicamos por qué, la gravedad del problema y cómo solucionarlo mediante muestreo de importancia.”

