Chapter 4 Dynamic Programming

時間 2020-12-27

原文原文鏈接

本筆記參考《Reinforcement Learning: An Introduction》和 David Silver的公開課及其ppt David Silver的課程在Tabular Soluction上介紹的比較多。可以配合David Silver的課程來理解《Reinforcement Learning: An Introduction》這本書的內容 DP指的是一組算法，可以用來計算最佳策

>>阅读原文<<