【強化學習】Q-learning

import random import matplotlib.pylab as plt #%matplotlib inline import gym env = gym.make('Taxi-v1') env.render() print(env.observation_space.n) print(env.action_space.n) 500 6 q = {} for s in range
相關文章
相關標籤/搜索