8.Imitation Learning模仿學習(李宏毅)

1.簡介 模仿學習有人又稱爲學徒制學習,示範學習,但又有人覺得只有逆向強化學習才能稱爲學徒制學習。示範學習就是人類示範給機器,讓機器去模仿學習。 不同於加強學習,在模仿學習中,機器可以與環境互動,但並不會得到Reward,因此模仿學習並非受到Reward影響,主要還是受到專家展示啓發。 使用模仿學習的主要幾點原因: Reward不好定義 如果手工製作的獎勵可能會造成無法控制的行爲,考試要100分是
相關文章
相關標籤/搜索