強化學習（一）——經典算法

時間 2021-01-13

原文原文鏈接

歡迎轉載，請註明出處：http://www.javashuo.com/article/p-xoxteayo-kb.html 主要從下面幾個模塊來介紹 1.任務與目標 2.單步強化學習:K-搖臂賭博機 3.有限多步強化學習:有模型學習 4.有限多步強化學習:免模型學習 5.無窮多步強化學習:值函數近似 6.模仿學習 1.任務與目標 2.單步強化學習:K-搖臂賭博機 3.有限多步強化學習:有模型學習

>>阅读原文<<