在調查過基於模型的強化學習方法後,咱們獲得這些結論

全部參與投票的 CSDN 用戶都參加抽獎活動前端 羣內公佈獎項,還有更多福利贈送git 做者 | Michael Janner程序員 譯者 | 孫薇github 編輯 | 夕顏算法 出品 | AI科技大本營(ID: rgznai100)c# 【導讀】強化學習系統的決策方式有兩種。基於模型的方法中,系統經過世界預測模型提問「若是執行了x會發生什麼」,從而選出最佳的x方案。在無模型的方法中,建模步驟被
相關文章
相關標籤/搜索