強化學習方法（一）：探索-利用困境exploration exploitation，Multi-armed bandit

時間 2021-01-19

標籤強化學習简体版

原文原文鏈接

歡迎轉載，轉載請註明：本文出自Bin的專欄blog.csdn.net/xbinworld。技術交流QQ羣：433250724，歡迎對算法、技術感興趣的同學加入。 18年新開一個強化學習方法系列，督促自己能夠再不斷擴充知識並分享給更多的同學。其實前面寫的機器學習方法系列和深度學習方法系列，也都還沒有寫夠，平時工作比較忙，更新很慢，但是我還是會努力更新的。今天開始記錄一些強化學習的知識，這些內容以前

>>阅读原文<<