Q-learning家族【強化學習】

時間 2021-01-01

原文原文鏈接

本文將講述經典的強化學習三部曲：Q-learning、DQN以及Double-DQN 先總結三者關係，Q-learning是經典智能算法，但是受限於高維拓展，於是DQN出現，將神經網絡應用於Q-learning，使得高維情況得以解決，至於Double DQN是爲了防止神經網絡的過度估計，把Double Q-learning和DQN結合，將選擇和評估action的網絡分開。 Q-learning 故

>>阅读原文<<