深度強化學習系列(二):強化學習基礎

本文是強化學習的基礎,主要參考 Divid Silver 教程,Reinforcement Learning:An Introduction,以及周志華的西瓜書。 可能之前大家已經聽過了強化學習的介紹,因此,我首先問幾個問題: 強化學習和MDP過程是一回事嗎? 強化學習和監督學習的區別是什麼? 什麼是值迭代,什麼是策略迭代? 有模型和無模型的強化學習的各自有什麼樣的學習方法? 強化學習和深度學習其
相關文章
相關標籤/搜索