第十四講--深度增強學習--課時33

看了好幾遍也沒看懂DQN neural network模擬Q-value function可以只將state作爲輸入,輸出爲各個Q(state,action)的值。並行計算各個動作,高效。 流程實在看不懂。。。 ----------------------------------------------------------------------------------------------
相關文章
相關標籤/搜索