第十四講--深度增強學習--課時33

時間 2021-01-14

原文原文鏈接

看了好幾遍也沒看懂DQN neural network模擬Q-value function可以只將state作爲輸入，輸出爲各個Q(state,action)的值。並行計算各個動作，高效。流程實在看不懂。。。 ----------------------------------------------------------------------------------------------

>>阅读原文<<