強化學習(二)——MDP:馬爾科夫決策過程

前言 本文主要採用了David Silver的RL授課ppt(個人認爲英文的ppt比中文更加生動準確),與個人聽課理解總結。本文詳細地介紹了馬爾科夫決策相關理論和目標。讀懂本文的前提是已經掌握理解了上一節:http://blog.csdn.net/wqy20140101/article/details/78562890 ok,我們開始吧! 馬爾科夫狀態 在我們所處的環境中,接下來會發生什麼事情,只
相關文章
相關標籤/搜索