深度強化學習——從DQN到DDPG

引言算法 深度強化學習最近取得了不少進展,並在機器學習領域獲得了不少的關注。傳統的強化學習侷限於動做空間和樣本空間都很小,且通常是離散的情境下。然而比較複雜的、更加接近實際狀況的任務則每每有着很大的狀態空間和連續的動做空間。實現端到端的控制也是要求能處理高維的,如圖像、聲音等的數據輸入。前些年開始興起的深度學習,恰好能夠應對高維的輸入,若是能將二者結合,那麼將使智能體同時擁有深度學習的理解能力和強
相關文章
相關標籤/搜索