機器學習知識點(三十五)蒙特卡羅方法

強化學習中免模型學習採用蒙特卡羅方法去逼近最優解,那這種採樣原理是怎樣的呢? 1、蒙特卡羅思想       是一類隨機方法的統稱。這類方法的特點是,可以在隨機採樣上計算得到近似結果,隨着採樣的增多,得到的結果是正確結果的概率逐漸加大,但在(放棄隨機採樣,而採用類似全採樣這樣的確定性方法)獲得真正的結果之前,無法知道目前得到的結果是不是真正的結果。       和拉斯維加斯算法相比,經典的描述就是:
相關文章
相關標籤/搜索