深度強化學習初窺之DQN

最近對強化學習特別是深度強化學習做了一番瞭解,不像以前只是大概模模糊糊有個影子,爲了加深印象,決定把相關內容記到這裏。首先對強化學習做簡要的介紹,之後介紹一下需要的相關背景知識,然後重點介紹一下深度Q學習(DQN)的算法理論以及實現過程。 關於強化學習,今年最爲着名成功實踐莫過於谷歌deep mind的alpha go,其於今年三月以4:1的比分擊敗了現役圍棋選手中冠軍數最多的李世石九段。由於圍棋
相關文章
相關標籤/搜索