強化學習 Q學習原理及例子(離散)附matlab程序

原文地址:http://mnemstudio.org/path-finding-q-learning-tutorial.htm 這篇教程通過簡單且易於理解的實例介紹了Q-學習的概念知識,例子描述了一個智能體通過非監督學習的方法對未知的環境進行學習。 假設我們的樓層內共有5個房間,房間之間通過一道門相連,正如下圖所示。我們將房間編號爲房間0到房間4,樓層的外部可以被看作是一間大房間,編號爲5。注意到
相關文章
相關標籤/搜索