機器學習(二十七)——Q-learning, 動態規劃

http://antkillerfarm.github.io/html Q-learning Q-learning是強化學習中很重要的算法,也是最先被引入DL領域的強化學習算法,對它的研究催生了Deep Q-learning Networks。java 下面用一個例子來說述Q-learning算法。ios 上圖中有5個房間,編號爲0~4,將戶外定義爲編號5,房間之間經過門相連,則房間的聯通關係可抽
相關文章
相關標籤/搜索