強化學習學習總結(一)——Qlearning

一、Qlearning算法思想構架 二、Qlearing算法程序實現  1.導入 import numpy as np import pandas as pd import time 2.給定初始值 N_STATES = 6 # 總長度the length of the 1 dimensional world ACTIONS = ['left', 'right
相關文章
相關標籤/搜索