【Tom M. Mitchell課件】機器學習——強化學習(1)

本課件主要內容包括: 強化學習 強化學習:西洋雙陸棋 強化學習問題 馬爾科夫決策過程 HMM,馬爾科夫過程,馬爾科夫決策過程 自主智能體的強化學習任務 每種策略的值函數 值迭代方法 Q學習 學習Q的訓練準則 更新策略 不確定情況 時間差分學習 MDP與RL MDP與強化學習的未來研究方向 完整課件下載地址: http://page2.dfpan.com/fs/flcj42211291c6efe78
相關文章
相關標籤/搜索