馬爾科夫決策過程及表格型方法

馬爾科夫決策過程及表格型方法 在說馬爾科夫決策的之前我們需要知道,馬爾科夫、馬爾科夫鏈和馬爾科夫獎勵。這是決策的基礎 文章目錄 馬爾科夫決策過程及表格型方法 一、馬爾科夫屬性 二、馬爾科夫鏈 三、馬爾科夫獎勵過程 四、馬爾可夫決策過程(MDP) 五、MDP 1)Q-table 2)折扣因子 3)時序差分(Temporal Difference): 4)SARSA算法: 一、馬爾科夫屬性 馬爾可夫屬
相關文章
相關標籤/搜索