20180610-reinforcement-learning-MDP

時間 2020-12-24

原文原文鏈接

【轉自本人個人博客 icesuns】 Reinforcement Learning(2)——MDPs 上一篇文章強化學習——簡介簡單介紹了一下強化學習的相關概念。這篇博客將引入馬爾科夫決策過程(Markov Decision Processes, MDPs)對強化學習進行建模。這篇文章，將對馬爾科夫決策過程以及Q-leaning進行介紹。馬爾科夫過程定義: 若隨機過程 {Xn,n∈T} {