Maze環境以及DQN的實現

環境 5*5的迷宮,其中(4,3)位置是出口,障礙物的位置分別爲(1,1)、(1,2)、(1,3)、(1,4)、(3,2)、(3,3)、(4,2) 動做空間固然4個,上下左右 直接上代碼~python import gym import tensorflow as tf import numpy as np import time import sys if sys.version_info.m
相關文章
相關標籤/搜索