TensorFlow應用實戰-18-Policy Gradient算法

Policy Gradient算法 mark policy Gradient算法不止一種。 有興趣的話: 深度增強學習之Policy Gradient方法1 https://zhuanlan.zhihu.com/p/21725498 # -*- coding: UTF-8 -*- """ Policy Gradient 算法(REINFORCE)。做決策的部分,相當於機器人的大腦 """ im
相關文章
相關標籤/搜索