Tensorflow實例:實現深度強化學習--策略網絡

深度強化學習簡介 強化學習(reinforcement Learning)是機器學習的一個重要分支,主要用來解決連續決策的問題。強化學習能夠在複雜的、不肯定的環境中學習如何實現咱們設定的目標。 一個強化學習問題包括三個主要概念,即python 環境狀態(Environment State) 行動(Action) 獎勵(Reward) 而強化學習的目標就是得到最多的累計獎勵。咱們要讓強化學習模型根據
相關文章
相關標籤/搜索