Asynchronous Advantage Actor-Critic (A3C)實現cart-pole

tensorflow實現: github代碼地址如下: https://github.com/wweichn/A3C.git 1 Asynchronous Advantage Actor-Critic (A3C)簡介   actor network,critic network 1 Actor觀測到state,得到action 2 critic對於state和action進行打分 3 actor根
相關文章
相關標籤/搜索