強化學習的常用方法

時間 2021-01-06

標籤深度學習強化學習算法简体版

原文原文鏈接

上一節我們講述了馬爾可夫過程，這一節我們要講的是強化學習中常用的方法。 Model-free和Model-based 我們可以將所有強化學習的方法分爲理不理解所處環境,如果我們不嘗試去理解環境, 環境給了我們什麼就是什麼. 我們就把這種方法叫做 model-free, 這裏的 model 就是用模型來表示環境, 那理解了環境也就是學會了用一個模型來代表環境, 所以這種就是 model-based

>>阅读原文<<