百度強化學習學習心得

百度強化學習學習心得 最近參加了百度的強化學習課程,對理論和編程實踐都有了很大的提升。 現在分享自己的課程筆記: 強化學習的重點在於:做決策,要知道怎麼做。 確定性策略和隨機性策略的理解更加深入了。 最基本的模型。 從本質上區分sarsa和Q學習。 PARL框架非常好用。 對DDPG的算法流程更加了解了。 經過此此課程,對自己的理論理解和代碼實踐都有了很大的提升。
相關文章
相關標籤/搜索