2019年伯克利大學 CS294-112《深度強化學習》第2講:監督學習和模仿學習(筆記)

今天的課程中,我們將討論模仿學習。我們首先來講序列決策問題的定義。我們將從一般的監督學習講到序列決策。我們將會講解如何設定一個模仿學習問題?它本質上是對決策問題的監督學習。我們將會討論直接模仿是否有效?它何時有效何時無效?以及我們如何使它能更頻繁地有效等等。作爲總結,我們將會講解最近的相關工作,關於深度模仿學習、使用模仿學習來從圖片中學習技能。最後如我們有足夠的時間,我們將稍微講解一下理論知識,分
相關文章
相關標籤/搜索