百度強化學習總結

雖然看過周志華的機器學習中強化學習一章,但仍然對一些概念不是很清楚,通過這次百度組織的強化學習課程,從代碼的角度對強化學習有了一些更深的體會。下面把我對強化學習相關知識作個梳理。 一、相關概念 1、定義:智能體通過在環境中不斷嘗試而學得一個「策略,根據這個策略,在狀態x下就能得到要執行的動作a。其關關鍵是如何學習到一個好的策略。 四元素<S,A,P,R>  兩個空間,兩個函數 S: 智能體在環境中
相關文章
相關標籤/搜索