強化學習 - 詳細解讀DQN

詳細解讀DQN 一. 強化學習 1. 什麼是強化學習問題? 2. 強化學習的理論體系 (1). MDP Markov Property Markov Process Markov Decision Process (2). R ( r e w a r d ) R(reward) R(reward) (3). V a l u e   F u n c t i o n Value\ Function V
相關文章
相關標籤/搜索