揭祕深度強化學習-3強化學習理論依據——馬爾科夫決策過程

看完覺得深受啓發的一篇文章,根據自己的理解翻譯過來留以後再次翻看 原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/ 馬爾科夫決策過程(Markov Decision Process) 現在我們來看看如何構造一個強化學習問題的公式。最常用的是基於馬爾科夫決策過程(Markov decision process)。
相關文章
相關標籤/搜索