Chapter3 Markov Decision Processes(MDP)

參考了《Reinforcement Learning: An Introduction》和 David Silver強化學習公開課, 這一章主要來自David Silver的ppt,建議直接看ppt,我只把容易犯錯的地方點出來了 馬爾科夫過程是強化學習的基礎 Finite Markov Decision Processes Markov property A state St S t is Mar
相關文章
相關標籤/搜索