強化學習課程學習(4)——基於Q表格的方式求解RL之Model-Based類型的方法

經過初始瞭解強化學習的基本要素後,單單地憑藉着這些要素還是無法構建強化學習模型來幫助我們解決實際問題,那麼最初地模型是基於Q表格的方式來解決問題,常見的模型可以分成model-based和model-free兩大類別,model-based常見的有MDP、DP;model-free常見的有MC、RASRA、Q-learning。 在本小章主要是闡述Model-based類型的常見方法。 基於Q表格
相關文章
相關標籤/搜索