2020李宏毅學習筆記——72 RL Advanced Version8.Imitation Learning

爲什麼要模仿學習 Imitation Learning (也稱爲 learning by demonstration, apprenticeship learning) 在某些情況下: 機器也可以和環境進行互動,但是不能明顯的得到reward 在某些任務中很難定義reward 人爲涉及的獎勵可能會得到不受控制的行爲 因此需要 imitation learning: 讓一個專家來示範應該如何解決問題
相關文章
相關標籤/搜索