強化學習學習總結(一)——Qlearning

1、Qlearning算法思想構架 2、Qlearing算法程序實現  1.導入python import numpy as np import pandas as pd import time 2.給定初始值算法 N_STATES = 6 # 總長度the length of the 1 dimensional world ACTIONS = ['left'
相關文章
相關標籤/搜索