【人工智能】做業4: PacMan遊戲實驗報告

時間 2019-12-07

原文原文鏈接

做業4: PacMan遊戲實驗報告吳政億 151220129 wuzy.nju@gmail.com (南京大學計算機科學與技術系, 南京 210093)java 摘要：使用強化學習來自主玩Mr. PACMAN遊戲。經過強化學習，獲得Q值函數，並根據Q值函數進行決策。理解並深刻研究使用的強化算法，並嘗試修改程序來提升學習性能。其中，理解epsilon greedy策略與折扣累計獎賞的含義web

>>阅读原文<<