深刻淺出的強化學習筆記(一)——概述

深刻淺出的強化學習筆記(一)——概述 本系列將針對強化學習,從基礎概念到最近十分熱門的模型求解算法Deep Q-learning(即DQN),全面講解強化學習的發展歷史和算法原理。web 1.強化學習的特徵 強化學習與有監督學習有幾分類似,但它並不存在明確的答案或者標籤,而有一個看上去相似但實則截然不同的概念——報酬。算法   下面以踢足球的進攻爲例,把強化學習和有監督學習的區別再講清楚一點。爲了
相關文章
相關標籤/搜索