TensorFlow應用實戰-18-Policy Gradient算法

時間 2021-01-02

原文原文鏈接

Policy Gradient算法 mark policy Gradient算法不止一種。有興趣的話: 深度增強學習之Policy Gradient方法1 https://zhuanlan.zhihu.com/p/21725498 # -*- coding: UTF-8 -*- """ Policy Gradient 算法（REINFORCE）。做決策的部分，相當於機器人的大腦 """ im

>>阅读原文<<