強化學習(1)

課程資料參見:https://github.com/zhoubolei/introRL 課件:https://github.com/zhoubolei/introRL/blob/master/lecture1.pdf 數列決策過程 機器感知和機器決策結合起來 和監督學習對比學習 監督學習:有標籤 強監督學習會希望數據儘量的i.i.d(IID即隨機的)可以消除數據之間的相關性 無監督學習:無標籤 強
相關文章
相關標籤/搜索