【Tom M. Mitchell課件】機器學習——強化學習(1)

時間 2021-01-18

原文原文鏈接

本課件主要內容包括：強化學習強化學習：西洋雙陸棋強化學習問題馬爾科夫決策過程 HMM，馬爾科夫過程，馬爾科夫決策過程自主智能體的強化學習任務每種策略的值函數值迭代方法 Q學習學習Q的訓練準則更新策略不確定情況時間差分學習 MDP與RL MDP與強化學習的未來研究方向完整課件下載地址： http://page2.dfpan.com/fs/flcj42211291c6efe78

>>阅读原文<<