強化學習基本方法(一)

1.基本概念 1.1.強化學習是什麼 在機器學習領域通常將機器學習劃分爲三大類型:有監督學習,無監督學習和強化學習。有監督學習和無監督學習都主要是爲了解決分類問題,而強化學習比較特殊,強化學習的目的是爲了研究策略,好比讓機器人自主的學會如何把花養好,如何在一個未知環境進行探索等。 強化學習的核心問題在於經過研究各類不一樣策略的價值並給予評價,來自主選擇最優策略。策略,便是決策層對於不一樣的狀態所做
相關文章
相關標籤/搜索