【5分鐘 Paper】Deep Recurrent Q-Learning for Partially Observable MDPs

時間 2021-01-02

原文原文鏈接

論文題目：Deep Recurrent Q-Learning for Partially Observable MDPs 這篇論文最開始是15年提出來的，但最新的修訂版本是17年的，下文所有內容都以17年版本爲主。論文鏈接：https://arxiv.org/abs/1507.06527 所解決的問題？如題目中所述，作者解決的就是部分可觀測馬爾可夫決策過程 (Partially-Obs

>>阅读原文<<