【強化學習】python 實現 q-learning 例四（例二改寫）

時間 2020-05-23

標籤強化學習 python 實現 learning 改寫欄目 Python 简体版

原文原文鏈接

將例二改寫成面向對象模式，並加了環境！html 不過更新環境的過程當中，用到了清屏命令，play()的時候，會有點問題。learn()的時候能夠勉強看到:P算法 0.效果圖 1.完整代碼相對於例一，修改的地方：dom Agent 五處：states, actions, rewards, get_valid_actions(), get_next_state()post

>>阅读原文<<