強化學習（二）：貪心策略（ε-greedy & UCB）

時間 2020-12-31

標籤強化學習简体版

原文原文鏈接

強化學習（二）：貪心策略（ε-greedy & UCB）夏梔的博客——王嘉寧的個人網站正式上線，歡迎訪問和關注：http://www.wjn1996.cn 強化學習是當前人工智能比較火爆的研究內容，作爲機器學習的一大分支，強化學習主要目標是讓智能體學習如何在給定的一個環境狀態下做出合適的決策。強化學習相關概念請點擊：強化學習（一）：概述強化學習任務中有兩個非常重要的概念——開發（ex

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。