深度強化學習——從DQN到DDPG

時間 2021-01-09

原文原文鏈接

引言深度強化學習最近取得了很多進展，並在機器學習領域得到了很多的關注。傳統的強化學習侷限於動作空間和樣本空間都很小，且一般是離散的情境下。然而比較複雜的、更加接近實際情況的任務則往往有着很大的狀態空間和連續的動作空間。實現端到端的控制也是要求能處理高維的，如圖像、聲音等的數據輸入。前些年開始興起的深度學習，剛好可以應對高維的輸入，如果能將兩者結合，那麼將使智能體同時擁有深度學習的理解能力和強化學

>>阅读原文<<