Q-learning 理解以及簡單實現

時間 2020-05-23

標籤 learning 理解以及簡單實現简体版

原文原文鏈接

強化學習（reinforcement learning）的過程，強化學習中有狀態(state)、動做(action)、獎賞(reward)這三個要素。智能體須要根據當前狀態來採起動做，得到相應的獎賞以後，再去改進這些動做，使得下次再到相同狀態時，智能體能作出更優的動做。git 下面以一個綜合全面的例子來理解Q-learning的過程。 http://mnemstudio.org/path-fin

>>阅读原文<<