強化學習方法(一):探索-利用困境exploration exploitation,Multi-armed bandit

歡迎轉載,轉載請註明:本文出自Bin的專欄blog.csdn.net/xbinworld。 技術交流QQ羣:433250724,歡迎對算法、技術感興趣的同學加入。 18年新開一個強化學習方法系列,督促自己能夠再不斷擴充知識並分享給更多的同學。其實前面寫的機器學習方法系列和深度學習方法系列,也都還沒有寫夠,平時工作比較忙,更新很慢,但是我還是會努力更新的。今天開始記錄一些強化學習的知識,這些內容以前
相關文章
相關標籤/搜索