DQN三大改進(三)-Dueling Network

1、Dueling Network 什麼是Dueling Deep Q Network呢?看下面的圖片 上面是我們傳統的DQN,下面是我們的Dueling DQN。在原始的DQN中,神經網絡直接輸出的是每種動作的 Q值, 而 Dueling DQN 每個動作的 Q值 是有下面的公式確定的: 它分成了這個 state 的值, 加上每個動作在這個 state 上的 advantage。我們通過下面這張
相關文章
相關標籤/搜索