【計算機科學】【2016.11】用於強化學習的深度學習方法

本文爲葡萄牙里斯本技術大學(作者:Daniel Luis Simões Marta)的碩士論文,共95頁。 本文主要研究了在強化學習中應用深度學習方法時,分離狀態感知和函數逼近的挑戰。作爲一個起點,高維狀態被認爲是將強化學習應用於現實任務時的基本限制。針對維數災難問題,我們建議降低數據的維數,以獲得簡潔的代碼(環境的內部表示),作爲強化學習框架中的替代狀態。在過去的幾十年中,人們採用了不同的方法,
相關文章
相關標籤/搜索