強化學習(二):貪心策略(ε-greedy & UCB)

強化學習(二):貪心策略(ε-greedy & UCB) 夏梔的博客——王嘉寧的個人網站 正式上線,歡迎訪問和關注:http://www.wjn1996.cn   強化學習是當前人工智能比較火爆的研究內容,作爲機器學習的一大分支,強化學習主要目標是讓智能體學習如何在給定的一個環境狀態下做出合適的決策。強化學習相關概念請點擊:強化學習(一):概述   強化學習任務中有兩個非常重要的概念——開發(ex
相關文章
相關標籤/搜索