2019年伯克利大學 CS294-112《深度強化學習》第3講:TensorFlow 和神經網絡簡述(筆記)

今天課的主要內容是TensorFlow的教程和深度神經網絡,由助教Greg Kahn主講。 在開始之前,想繼續講一下上週的一些討論,因爲上次最後沒有講完的所有理論,這是上星期的課程的一點尾巴。在很多場景下,模仿學習是一個學習策略的合適方法,但是在另外一些場景,模仿學習就力不從心了,這也是課程要講強化學習的理由。如果你想超越模仿學習,非常重要的是確切的定義出一個決定是好是壞,而不是僅僅說採取的行動符
相關文章
相關標籤/搜索