DRL之DQN Deep Q Network 學習總結

時間 2021-01-15

原文原文鏈接

本次總結從最底下的Ref Links的material中得來，如果對於某些細節不清楚可以看看鏈接中的內容。我在看10-703的視頻的時候，我覺得Russ講課還是很不錯的，很多東西講得言簡意賅，短短几句就把DQN的核心講得清楚。 RL中核心的三個東西：policy，model和value function。policy就是根據當前的state進行對應的action，當然可以是deterministi

>>阅读原文<<