基於Q-Learning算法的機器人路徑規劃

最近一直在研究強化學習中的Q學習算法,鑑於網上的代碼對於新手來講太過於複雜,我在MATLAB以及Python下都寫了相對容易的代碼,以便於新手理解與學習。python python代碼:算法 ''' 1,環境:先從簡單的6x6的方格環境作起,起始位置爲右下角,終止位置爲右上角, 其中選中兩處爲障礙物,其他的位置爲平地,環境的選擇爲座標系(0,0)->(5,5). 2,選擇的動做爲‘上下左右’,步長
相關文章
相關標籤/搜索