強化學習(二)：馬爾科夫決策過程(Markov decision process)

時間 2020-06-22

標籤強化學習決策過程 markov decision process 简体版

原文原文鏈接

本章是強化學習的基礎，主要講的就是馬爾科夫決策過程，之後的內容都是以這一節爲基礎的，因此對本節的相關概念的理解是很重要的。web 這一節的概念比較多，也是後面章節的基礎，一開始筆者也是一頭霧水，只有多看幾遍，多去思考，才能慢慢理解。畢竟概念與定義比較多，想要一會兒消化完仍是有一些難度的。這篇博客也是筆者看完David Silver的公開課與其它一些參考資料後的理解，但願對你們有所幫助。算法爲何在

>>阅读原文<<