基於Q-Learning算法的機器人路徑規劃

時間 2020-05-23

標籤基於 learning 算法機器人路徑規劃简体版

原文原文鏈接

最近一直在研究強化學習中的Q學習算法，鑑於網上的代碼對於新手來講太過於複雜，我在MATLAB以及Python下都寫了相對容易的代碼，以便於新手理解與學習。python python代碼：算法 ''' 1,環境：先從簡單的6x6的方格環境作起,起始位置爲右下角,終止位置爲右上角, 其中選中兩處爲障礙物,其他的位置爲平地，環境的選擇爲座標系(0,0)->(5,5). 2,選擇的動做爲‘上下左右’,步長

>>阅读原文<<