【Tom M. Mitchell課件】機器學習——強化學習(2)

本課件主要內容包括: HMM,馬爾可夫過程,馬爾可夫決策過程 非確定的情況 時間差分學習 MDP與RL MDP與強化學習:未來發展方向 關於動物的強化學習? 人類學習的RL模型 大腦的RL理論 時間差ML模型:預測學習過程中多巴胺能神經元活性 完整課件下載地址: http://page2.dfpan.com/fs/6l6c1j12a211f249163/ 更多精彩文章請關注微信號:
相關文章
相關標籤/搜索