強化學習Q learning與policy gradient

時間 2020-01-29

標籤強化學習 learning policy gradient 简体版

原文原文鏈接

開始學習強化學習：git 包括alphago等都是強化學習的典型。github 最典型的強化學習的算法爲Q learning，這個算法的簡介博客：算法 https://www.zhihu.com/question/26408259 網絡強化學習的github項目：https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflo

>>阅读原文<<