【計算機科學】【2016.11】用於強化學習的深度學習方法

時間 2020-12-30

原文原文鏈接

本文爲葡萄牙里斯本技術大學（作者：Daniel Luis Simões Marta）的碩士論文，共95頁。本文主要研究了在強化學習中應用深度學習方法時，分離狀態感知和函數逼近的挑戰。作爲一個起點，高維狀態被認爲是將強化學習應用於現實任務時的基本限制。針對維數災難問題，我們建議降低數據的維數，以獲得簡潔的代碼（環境的內部表示），作爲強化學習框架中的替代狀態。在過去的幾十年中，人們採用了不同的方法，

>>阅读原文<<