深度強化學習總結和理解

強化學習總結和理解,都是自己最近學習的總結 ,如果有不對的地方還請指出 這一週一直在學強化學習,總結了常見經典算法,強化學習的資源很少,2015年alphago的成功才火起來。不知道未來會不會繼續有突破,學完感覺比深度學習難了很多,資源也非常少,對數學要求極高,還需要提高數學和實踐能力,以下爲自己看了幾十遍算法總結的心得。 強化學習分爲在線學習和離線學習 Off-policy:q-learning
相關文章
相關標籤/搜索