Tensorflow實例：實現深度強化學習--策略網絡

時間 2019-12-05

原文原文鏈接

深度強化學習簡介強化學習（reinforcement Learning）是機器學習的一個重要分支，主要用來解決連續決策的問題。強化學習能夠在複雜的、不肯定的環境中學習如何實現咱們設定的目標。一個強化學習問題包括三個主要概念，即python 環境狀態（Environment State）行動（Action）獎勵（Reward）而強化學習的目標就是得到最多的累計獎勵。咱們要讓強化學習模型根據

>>阅读原文<<