Chapter3 Markov Decision Processes(MDP)

時間 2021-01-11

原文原文鏈接

參考了《Reinforcement Learning: An Introduction》和 David Silver強化學習公開課，這一章主要來自David Silver的ppt，建議直接看ppt，我只把容易犯錯的地方點出來了馬爾科夫過程是強化學習的基礎 Finite Markov Decision Processes Markov property A state St S t is Mar