2020李宏毅學習筆記——72 RL Advanced Version8.Imitation Learning

時間 2021-01-16

原文原文鏈接

爲什麼要模仿學習 Imitation Learning (也稱爲 learning by demonstration, apprenticeship learning) 在某些情況下: 機器也可以和環境進行互動，但是不能明顯的得到reward 在某些任務中很難定義reward 人爲涉及的獎勵可能會得到不受控制的行爲因此需要 imitation learning: 讓一個專家來示範應該如何解決問題

>>阅读原文<<