【強化學習】SARSA

import matplotlib.pylab as plt #%matplotlib inline import random import gym env = gym.make('Taxi-v1') env.render() Q = {} for s in range(env.observation_space.n): for a in range(env.action_space.
相關文章
相關標籤/搜索