強化學習(一)——經典算法

歡迎轉載,請註明出處:http://www.javashuo.com/article/p-xoxteayo-kb.html 主要從下面幾個模塊來介紹 1.任務與目標 2.單步強化學習:K-搖臂賭博機 3.有限多步強化學習:有模型學習 4.有限多步強化學習:免模型學習 5.無窮多步強化學習:值函數近似 6.模仿學習 1.任務與目標  2.單步強化學習:K-搖臂賭博機 3.有限多步強化學習:有模型學習
相關文章
相關標籤/搜索