強化學習:Q-learning與DQN(Deep Q Network)

文章目錄 Q-learning 一些名詞 epsilon-greedy 算法流程 DQN 記憶庫(Experience replay) 固定Q-目標(Fixed Q-target) 算法流程   Q-learning是一種很經常使用很傳統的強化學習方法,DQN是Q-learning和神經網絡的結合,是近年來很火的強化學習方法。html Q-learning   Q-learning會輸出一張Q值表
相關文章
相關標籤/搜索