複習_強化學習

強化學習常用的方法有基於值函數逼近的強化學習和基於確定性策略搜索的強化學習; 基於值函數逼近的強化學習主要解決狀態空間很大或者連續情況下的強化學習問題;包括DQN,double DQN,dueling DQN等; DQN:Human-level control through deep reinforcement learning  Double DQN:Deep Reinforcement Le
相關文章
相關標籤/搜索