馬爾可夫Markov決策過程

1. Markov Processes馬爾可夫過程 1.1 Markov Property馬爾可夫性 在瞭解馬爾可夫過程之前,我們首先得了解什麼是馬爾可夫性,馬爾可夫性其實是一種假設,「未來的一切僅與現在有關,獨立於過去的狀態」。 關於馬爾可夫性,我們給出瞭如下的Definition: 從上述的式子可以看出,t+1時刻的狀態包含了1,…,t時刻狀態的全部歷史信息,並且當我們知道t時刻的狀態後,我們
相關文章
相關標籤/搜索