強化學習入門總結

目錄git 1、強化學習概述github 1.強化學習簡介算法 2.發展歷程:網絡 3.MDP(馬兒可夫決策過程)app 4.why RL?框架 5.總結:less 2、強化學習求解方法dom 1.動態規劃方法機器學習 2.蒙特卡洛方法函數 3.時間差分方法 3、強化學習算法分類 1.分類一: 2.分類二: 3.分類三: 4.分類四: 4、表明性算法 1.Q-learning 2.Sarsa: 3
相關文章
相關標籤/搜索