強化學習:Q-學習

這篇教程通過簡單且易於理解的實例介紹了Q-學習的概念知識,例子描述了一個智能體通過非監督學習的方法對未知的環境進行學習。 假設我們的樓層內共有5個房間,房間之間通過一道門相連,正如下圖所示。我們將房間編號爲房間0到房間4,樓層的外部可以被看作是一間大房間,編號爲5。注意到房間1和房間4可以直接通到房間5。 我們可以用圖來表示上述的房間,將每一個房間看作是一個節點,每一道門看作是一條邊(鏈路)。 在
相關文章
相關標籤/搜索