強化學習Q learning與policy gradient

開始學習強化學習:git 包括alphago等都是強化學習的典型。github 最典型的強化學習的算法爲Q learning,這個算法的簡介博客:算法 https://www.zhihu.com/question/26408259 網絡 強化學習的github項目:https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflo
相關文章
相關標籤/搜索