深入淺出的強化學習筆記(一)——概述

深入淺出的強化學習筆記(一)——概述 本系列將針對強化學習,從基礎概念到最近十分熱門的模型求解算法Deep Q-learning(即DQN),全面講解強化學習的發展歷史和算法原理。 1.強化學習的特徵 強化學習與有監督學習有幾分相似,但它並不存在明確的答案或者標籤,而有一個看上去類似但實則大相徑庭的概念——報酬。   下面以踢足球的進攻爲例,把強化學習和有監督學習的區別再講清楚一點。爲了完成一次進
相關文章
相關標籤/搜索