強化學習Q learning與policy gradient

開始學習強化學習: 包括alphago等都是強化學習的典型。 最典型的強化學習的算法爲Q learning,這個算法的簡介博客: https://www.zhihu.com/question/26408259 強化學習的github項目:https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow 裏面包含了很多算法的例子
相關文章
相關標籤/搜索