【deepRL】分層強化學習論文筆記(一)

什麼是分層強化學習 解決稀疏獎勵問題通常有兩種思路:對動作進行分層,將low-level動作組成high-level元動作,這樣搜索空間就會被降低。然而這種分層方法通常需要較多的領域知識,並且需要仔細地設計。第二種方式是利用內在激勵來引導智能體探索,這種方式不需要領域知識,但是當面對一系列任務時,這類方法沒有辦法將關於某個任務的知識遷移到另外一個任務,每次解決新的任務時候都需要從頭學起,大大增加了
相關文章
相關標籤/搜索