複習_強化學習

時間 2021-01-21

原文原文鏈接

強化學習常用的方法有基於值函數逼近的強化學習和基於確定性策略搜索的強化學習；基於值函數逼近的強化學習主要解決狀態空間很大或者連續情況下的強化學習問題；包括DQN，double DQN，dueling DQN等； DQN：Human-level control through deep reinforcement learning Double DQN：Deep Reinforcement Le

>>阅读原文<<