強化學習: Experience Replay

我第一次接觸 Experience Replay 概念是李宏毅老師的視頻課上。當時李宏毅老師說 爲什麼Experience Replay 可行留作自己思考,然後並沒有做太詳細的解釋。接下來,我就把我對Experience Replay 的理解寫下來。 首先,我把李宏毅老師的Q-learning 算法貼出來,他的Q-learning 算法跟傳統Q-learning 算法有一些微小的區別 以下是Exp
相關文章
相關標籤/搜索