他們一直說不要將模型擬人化,但所有好的技術似乎都是我們一直以來對人類、行為和學習的研究的類比。 “強化學習在任務接近能力極限時效果最佳。”這是一篇很有趣的論文,值得一讀。不過,這裡的資訊大多對於擁有大量強化學習經驗的人來說,都是經驗之談。 但它的文筆很好,我讀得很開心。