深度強化學習(DRL)三:從Q-learning到Deep Q Network(DQN)

目錄 1、Q-learning 2、Deep Q Network 3、Double DQN 1、Q-learning 關於Q-learning,網上的資料不少,簡單的總結一下它的特色。html Q-learning最核心的是有一個Q表,它記錄了在環境中的 全部狀態(s) 以及每一個狀態能夠進行的 全部行爲(a) 的Q值,初值設爲0。python 狀態 \ 行爲 a1 a2 a3 a4 s1 s2
相關文章
相關標籤/搜索