強化學習系列:Deep Q Network (DQN)

時間 2021-01-15

原文原文鏈接

我們終於來到了深度強化學習。 1. 強化學習和深度學習結合機器學習=目標+表示+優化。目標層面的工作關心應該學習到什麼樣的模型，強化學習應該學習到使得激勵函數最大的模型。表示方面的工作關心數據表示成什麼樣有利於學習，深度學習是最近幾年興起的表示方法，在圖像和語音的表示方面有很好的效果。深度強化學習則是兩者結合在一起，深度學習負責表示馬爾科夫決策過程的狀態，強化學習負責把控

>>阅读原文<<