強化學習的常用方法

上一節我們講述了馬爾可夫過程, 這一節我們要講的是強化學習中常用的方法。 Model-free和Model-based 我們可以將所有強化學習的方法分爲理不理解所處環境,如果我們不嘗試去理解環境, 環境給了我們什麼就是什麼. 我們就把這種方法叫做 model-free, 這裏的 model 就是用模型來表示環境, 那理解了環境也就是學會了用一個模型來代表環境, 所以這種就是 model-based
相關文章
相關標籤/搜索