馬爾科夫決策過程

Markov Decision Processes 資料來源:http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching_files/MDP.pdf Markov Process可表示爲 < S , P > <S, P> <S,P> 其中 S S S爲有限狀態集, P P P爲狀態轉移矩陣,我們關注的是狀態的轉移 MRP( Ma
相關文章
相關標籤/搜索