深度強化學習從入門到放棄

本筆記來自於臺大李宏毅機器學習課程–Reinforcement Learning 前面寫過CNN入門與集成學習,這些均屬於監督學習的範疇,而強化學習與監督學習是有很大區別的 其中監督學習是有特徵(feature)和標籤(label)的,即便是沒有標籤的,機器也是可以通過特徵和標籤之間的關係,判斷出標籤。舉例子理解:高考試題是在考試前就有標準答案的,在學習和做題的過程中,可以對照答案,分析問題找出方
相關文章
相關標籤/搜索