【deepRL】分層強化學習論文筆記（一）

時間 2021-01-13

原文原文鏈接

什麼是分層強化學習解決稀疏獎勵問題通常有兩種思路：對動作進行分層，將low-level動作組成high-level元動作，這樣搜索空間就會被降低。然而這種分層方法通常需要較多的領域知識，並且需要仔細地設計。第二種方式是利用內在激勵來引導智能體探索，這種方式不需要領域知識，但是當面對一系列任務時，這類方法沒有辦法將關於某個任務的知識遷移到另外一個任務，每次解決新的任務時候都需要從頭學起，大大增加了

>>阅读原文<<