[增強學習][Reinforcement Learning]學習筆記與回顧-2-馬爾可夫決策過程MDP

Markov Decision Processes 前言 本文主要是視頻學習的總結與回顧,想要了解更多內容請看視頻或者學習專業課程。這一節主要是說馬爾可夫決策過程-Markov Decision Processes,也成MDP。 在瞭解MDP之前,如果大家瞭解過馬爾可夫鏈(markov chain),或者機器學習中的隱馬爾可夫過程,那麼對於馬爾可夫性就會有一定了解,即無後效性。 Introduct
相關文章
相關標籤/搜索