強化學習：Q-learning與DQN（Deep Q Network）

時間 2020-08-08

標籤強化學習 learning dqn deep network 欄目系統網絡简体版

原文原文鏈接

文章目錄 Q-learning 一些名詞 epsilon-greedy 算法流程 DQN 記憶庫(Experience replay) 固定Q-目標(Fixed Q-target) 算法流程 Q-learning是一種很經常使用很傳統的強化學習方法，DQN是Q-learning和神經網絡的結合，是近年來很火的強化學習方法。html Q-learning Q-learning會輸出一張Q值表

>>阅读原文<<