Python手寫強化學習Q-learning算法玩井字棋

時間 2020-05-23

標籤 python 手寫強化學習 learning 算法井字欄目 Python 简体版

原文原文鏈接

Q-learning 是強化學習中的一種常見的算法，近年來因爲深度學習革命而取得了很大的成功。本教程不會解釋什麼是深度 Q-learning，但咱們將經過 Q-learning 算法來使得代理學習如何玩 tic-tac-toe 遊戲。儘管它很簡單，但咱們將看到它能產生很是好的效果。html 要理解本教程，沒必要有任何關於強化學習的知識，但最好有必定的微積分和線性代數基礎。首先，咱們將經過一些必要的

>>阅读原文<<