強化學習(二):馬爾科夫決策過程(Markov decision process)

本章是強化學習的基礎,主要講的就是馬爾科夫決策過程,之後的內容都是以這一節爲基礎的,因此對本節的相關概念的理解是很重要的。web 這一節的概念比較多,也是後面章節的基礎,一開始筆者也是一頭霧水,只有多看幾遍,多去思考,才能慢慢理解。畢竟概念與定義比較多,想要一會兒消化完仍是有一些難度的。這篇博客也是筆者看完David Silver的公開課與其它一些參考資料後的理解,但願對你們有所幫助。算法 爲何在
相關文章
相關標籤/搜索