【強化學習】第三篇--蒙特卡洛方法

做者:王小草 筆記時間:2019年1月22日web 1 蒙特卡羅法的起源 蒙特卡羅法的名字來源於世界著名的賭城蒙特卡羅。是用隨機數來解決計算問題,即以機率爲基礎的方法。bootstrap 套路是:生成隨機樣本–>試驗屢次–>總結經驗框架 利用蒙特卡羅法計算圓周率π: ide 利用蒙特卡羅法測量不規則圖形的面積: svg 2 蒙特卡羅法MC概述 2.1 MC與DP的差別 首先來看看馬爾科夫決策過程的
相關文章
相關標籤/搜索