百度強化學習7日課程筆記

百度強化學習7日打卡營課程筆記 上週參加了百度的強化學習7日打卡營,科老師的講解非常有條理,且將代碼與知識點結合起來,使得不擅長公式推導的小白得以瞭解強化學習領域的入門知識以及百度的PaddlePaddle框架,並且有機會自己嘗試調試簡單的強化學習程序。 現將部分課程筆記整理如下,共5節課。 第一課-強化學習(RL)概況 第二課-基於表格型方法求解RL 應用場景:離散狀態+離散動作,確定性策略 O
相關文章
相關標籤/搜索