Deep Q-Learning深度加強學習(代碼篇)

搭建DQN 初始化 #動做數量 self.n_actions #狀態數量 self.n_features #learning_rate學習速率 self.lr #Q-learning中reward衰減因子 self.gamma #e-greedy的選擇機率最大值 self.epsilon_max #更新Q現實網絡參數的步驟數 self.replace_target_iter #存儲記憶的數量
相關文章
相關標籤/搜索