百度PARL強化學習入門7日營

時間 2020-07-20

標籤百度 parl 強化學習入門 7日简体版

原文原文鏈接

百度PARL強化學習入門7日營筆記強化學習初探表格型方法 (Tabular Solution Methods) MDP和TD方法 Sarsa Q-learning 神經網絡+Q-learning: DQN 策略梯度 (Policy Gradient) DDPG (Deep Deterministic Policy Gradient) 感想後續筆記強化學習初探強化學習(Reinforc

>>阅读原文<<