強化學習(一)強化學習的基本概念、e貪心算法、Softmax算法

強化學習(reinforcement learning,RL)是機器學習的一個領域,主要通過在環境(environment)中採取動作(action),來最大化某些指標,例如累計獎賞(cumulative reward)的一種學習方法。強化學習、有監督學習(supervised learning)與無監督學習(unsupervised learning)三者共同構成了機器學習的三個重要方面 Rei
相關文章
相關標籤/搜索