【Tom M. Mitchell課件】機器學習——強化學習(2)

時間 2021-01-18

原文原文鏈接

本課件主要內容包括： HMM，馬爾可夫過程，馬爾可夫決策過程非確定的情況時間差分學習 MDP與RL MDP與強化學習：未來發展方向關於動物的強化學習？人類學習的RL模型大腦的RL理論時間差ML模型：預測學習過程中多巴胺能神經元活性完整課件下載地址： http://page2.dfpan.com/fs/6l6c1j12a211f249163/ 更多精彩文章請關注微信號：

>>阅读原文<<