強化學習系列:Deep Q Network (DQN)

      我們終於來到了深度強化學習。 1. 強化學習和深度學習結合       機器學習=目標+表示+優化。目標層面的工作關心應該學習到什麼樣的模型,強化學習應該學習到使得激勵函數最大的模型。表示方面的工作關心數據表示成什麼樣有利於學習,深度學習是最近幾年興起的表示方法,在圖像和語音的表示方面有很好的效果。深度強化學習則是兩者結合在一起,深度學習負責表示馬爾科夫決策過程的狀態,強化學習負責把控
相關文章
相關標籤/搜索