在調查過基於模型的強化學習方法後，咱們獲得這些結論

時間 2020-01-14

標籤在調查過基於模型強化學習方法咱們獲得這些結論简体版

原文原文鏈接

全部參與投票的 CSDN 用戶都參加抽獎活動前端羣內公佈獎項，還有更多福利贈送git 做者 | Michael Janner程序員譯者 | 孫薇github 編輯 | 夕顏算法出品 | AI科技大本營（ID: rgznai100）c# 【導讀】強化學習系統的決策方式有兩種。基於模型的方法中，系統經過世界預測模型提問「若是執行了x會發生什麼」，從而選出最佳的x方案。在無模型的方法中，建模步驟被

>>阅读原文<<