李宏毅深度強化學習筆記(七)Sparse Reward

參考jessie_weiqing博客:http://www.javashuo.com/article/p-xflsdvey-sw.html 李宏毅深度強化學習課程 https://www.bilibili.com/video/av24724071 李宏毅深度強化學習筆記(七)Sparse Reward Reward Shaping 當reward的分佈非常分散時,對於機器而言學習如何行動會十分困難
相關文章
相關標籤/搜索