強化學習概述(An Overview of Reinforcement Learning)

一、強化學習的特點 強化學習(RL)和規劃(Planning)的不同 總結一下,強化學習和規劃哪裏不同? 強化學習看到的世界一個黑箱子,而對於規劃而言,這個世界卻是很清楚的。比如我們的最短路徑,所有的節點、便點、權重點都是已知的;而對於強化學習,狀態如何轉移、邊的權制是多少、甚至有哪些狀態都需要自己探索、發現。 規劃的問題可能就是一個解、一個路徑;而強化學習的解是一個模型。和監督學習一樣,只要輸入
相關文章
相關標籤/搜索