【人工智能】做業4: PacMan遊戲 實驗報告

做業4: PacMan遊戲 實驗報告 吳政億 151220129 wuzy.nju@gmail.com (南京大學 計算機科學與技術系, 南京 210093)java 摘要:使用強化學習來自主玩Mr. PACMAN遊戲。經過強化學習,獲得Q值函數,並根據Q值函數進行決策。理解並深刻研究使用的強化算法,並嘗試修改程序來提升學習性能。其中,理解epsilon greedy策略與折扣累計獎賞的含義web
相關文章
相關標籤/搜索