揭祕深度強化學習-3強化學習理論依據——馬爾科夫決策過程

時間 2021-01-11

原文原文鏈接

看完覺得深受啓發的一篇文章，根據自己的理解翻譯過來留以後再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/ 馬爾科夫決策過程（Markov Decision Process）現在我們來看看如何構造一個強化學習問題的公式。最常用的是基於馬爾科夫決策過程(Markov decision process)。

>>阅读原文<<