強化學習之Q函數的個人理解

首先了解爲什麼要用強化學習?強化學習是智能體(Agent)與環境之間一種學習和反饋。就像狗撞在玻璃門上兩次,第三次它就不會再去跑到玻璃門了。可以通過強化學習來實現經驗的快速積累,並針對實時情況作出動態規劃(注意強化學習和無監督學習的區別)其中,用的最廣泛的就是Q Learning了。 Q Learning是由Q函數引出來了的,因此先給出Q函數和V函數的定義。 -------------------
相關文章
相關標籤/搜索