深度學習課程筆記(七):模仿學習(imitation learning)

深度學習課程筆記(七):模仿學習(imitation learning) 2017.12.10         本文所涉及到的 模仿學習,則是從給定的展示中進行學習。機器在這個過程中,也和環境進行交互,但是,並沒有顯示的得到 reward。在某些任務上,也很難定義 reward。如:自動駕駛,撞死一人,reward爲多少,撞到一輛車,reward 爲多少,撞到小動物,reward 爲多少,撞到 X
相關文章
相關標籤/搜索