Deep Q-Learning深度加強學習（代碼篇）

時間 2020-07-20

標籤 deep learning 深度加強學習代碼简体版

原文原文鏈接

搭建DQN 初始化 #動做數量 self.n_actions #狀態數量 self.n_features #learning_rate學習速率 self.lr #Q-learning中reward衰減因子 self.gamma #e-greedy的選擇機率最大值 self.epsilon_max #更新Q現實網絡參數的步驟數 self.replace_target_iter #存儲記憶的數量

>>阅读原文<<