【5分鐘 Paper】Deep Recurrent Q-Learning for Partially Observable MDPs

論文題目:Deep Recurrent Q-Learning for Partially Observable MDPs   這篇論文最開始是15年提出來的,但最新的修訂版本是17年的,下文所有內容都以17年版本爲主。 論文鏈接:https://arxiv.org/abs/1507.06527 所解決的問題?   如題目中所述,作者解決的就是部分可觀測馬爾可夫決策過程 (Partially-Obs
相關文章
相關標籤/搜索