DRL之DQN Deep Q Network 學習總結

本次總結從最底下的Ref Links的material中得來,如果對於某些細節不清楚可以看看鏈接中的內容。我在看10-703的視頻的時候,我覺得Russ講課還是很不錯的,很多東西講得言簡意賅,短短几句就把DQN的核心講得清楚。 RL中核心的三個東西:policy,model和value function。policy就是根據當前的state進行對應的action,當然可以是deterministi
相關文章
相關標籤/搜索