強化學習淺談

一直對強化學習很感興趣,畢業前那會也嘗試着去學習,但由於當時感受強化學習的公式晦澀難懂,沒能堅持下去。最近因工做須要,又從新開始啃強化學習的知識,發現有了新的體會,故在此記錄一下,以便之後隨時翻看查閱。   機器學習包含了三大分支,有監督學習(或半監督)、無監督學習和強化學習。同前二者相比,強化學習具備以下特色,   (1) 沒有「supervisor」,只有「reward」信號;   (2) 反
相關文章
相關標籤/搜索