馬爾科夫決策過程

時間 2021-01-11

原文原文鏈接

Markov Decision Processes 資料來源:http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching_files/MDP.pdf Markov Process可表示爲 < S , P > <S, P> <S,P> 其中 S S S爲有限狀態集， P P P爲狀態轉移矩陣，我們關注的是狀態的轉移 MRP( Ma

>>阅读原文<<