[歸納]強化學習導論 - 本書第一Part總結

文章目錄 1.本書第一部分總結:方法空間 參考文獻 1.本書第一部分總結:方法空間 這一章總結了本書Part I的所有內容,RL並不是一些孤立方法的集合,RL實際上是具有一致的一些想法的集合,每個想法都能看作方法變化的一個dimension,這些dimensions可以組合成一個很大的方法空間。通過dimensions的層面探索問題空間,我們希望能獲得更廣泛和深入的理解。這小節我們利用方法空間di
相關文章
相關標籤/搜索