深度強化學習總結和理解

時間 2020-12-30

標籤強化學習简体版

原文原文鏈接

強化學習總結和理解，都是自己最近學習的總結，如果有不對的地方還請指出這一週一直在學強化學習，總結了常見經典算法，強化學習的資源很少，2015年alphago的成功才火起來。不知道未來會不會繼續有突破，學完感覺比深度學習難了很多，資源也非常少，對數學要求極高，還需要提高數學和實踐能力，以下爲自己看了幾十遍算法總結的心得。強化學習分爲在線學習和離線學習 Off-policy:q-learning

>>阅读原文<<