Eles continuam dizendo para não antropomorfizar os modelos, mas todas as boas técnicas parecem ser analogias daquilo que estudamos sobre seres humanos, comportamento e aprendizagem durante todo esse tempo. "O aprendizado por reforço funciona melhor quando as tarefas estão no limite da competência."
Este é um artigo interessante e recomendo a sua leitura. Embora a maior parte da informação aqui apresentada seja algo que pessoas com muita experiência de vida já saberiam por vivência. Mas está bem escrito e gostei de ler.

