強化學習（一）強化學習的基本概念、e貪心算法、Softmax算法

時間 2021-01-15

標籤強化學習機器學習人工智能简体版

原文原文鏈接

強化學習（reinforcement learning，RL）是機器學習的一個領域，主要通過在環境（environment）中採取動作（action），來最大化某些指標，例如累計獎賞（cumulative reward）的一種學習方法。強化學習、有監督學習（supervised learning）與無監督學習（unsupervised learning）三者共同構成了機器學習的三個重要方面 Rei

>>阅读原文<<