馬爾科夫決策過程MDP

出處:http://www.fengchang.cc/post/11 參考這裏 和 這裏 A Markov Decision Process (MDP) model contains: A set of possible world states S. A set of Models. A set of possible actions A. A real valued reward functi
相關文章
相關標籤/搜索