李宏毅深度強化學習筆記（七）Sparse Reward

時間 2021-01-16

原文原文鏈接

參考jessie_weiqing博客：http://www.javashuo.com/article/p-xflsdvey-sw.html 李宏毅深度強化學習課程 https://www.bilibili.com/video/av24724071 李宏毅深度強化學習筆記（七）Sparse Reward Reward Shaping 當reward的分佈非常分散時，對於機器而言學習如何行動會十分困難

>>阅读原文<<