深度強化學習初窺之DQN

時間 2021-01-09

原文原文鏈接

最近對強化學習特別是深度強化學習做了一番瞭解，不像以前只是大概模模糊糊有個影子，爲了加深印象，決定把相關內容記到這裏。首先對強化學習做簡要的介紹，之後介紹一下需要的相關背景知識，然後重點介紹一下深度Q學習（DQN）的算法理論以及實現過程。關於強化學習，今年最爲着名成功實踐莫過於谷歌deep mind的alpha go，其於今年三月以4：1的比分擊敗了現役圍棋選手中冠軍數最多的李世石九段。由於圍棋

>>阅读原文<<