Chapter 4 Dynamic Programming

本筆記參考《Reinforcement Learning: An Introduction》和 David Silver的公開課及其ppt David Silver的課程在Tabular Soluction上介紹的比較多。可以配合David Silver的課程來理解《Reinforcement Learning: An Introduction》這本書的內容 DP指的是一組算法,可以用來計算最佳策
相關文章
相關標籤/搜索