什麼是馬爾可夫決策過程

作者|Nathan Lambert 編譯|VK 來源|Towards Data Science 關於馬爾可夫決策過程的馬爾可夫是什麼? 馬爾可夫是安德烈·馬爾科夫(Andrey Markov),​​他是著名的俄羅斯數學家,以其在隨機過程中的工作而聞名。 「馬爾可夫」通常意味着在當前狀態下,未來和過去是獨立的。 建立Markovian系統的關鍵思想是無記憶。無記憶是系統歷史不會影響當前狀態的想法。用
相關文章
相關標籤/搜索