Q-learning家族【強化學習】

本文將講述經典的強化學習三部曲:Q-learning、DQN以及Double-DQN 先總結三者關係,Q-learning是經典智能算法,但是受限於高維拓展,於是DQN出現,將神經網絡應用於Q-learning,使得高維情況得以解決,至於Double DQN是爲了防止神經網絡的過度估計,把Double Q-learning和DQN結合,將選擇和評估action的網絡分開。 Q-learning 故
相關文章
相關標籤/搜索