Q-learning

原文:http://blog.sina.com.cn/s/blog_9409e4a3010137gm.htmlhtml 環境建模算法 假設在一個建築裏有5個房間經過門連通以下圖所示,咱們給5個房間依次命名爲A~E。如今考慮咱們站在外面的一個大房間F,且房間F覆蓋了建築其他全部空間。也就是從F能夠進入B或E房間。dom 咱們能夠將每一個房間表示爲一個節點,每扇門做爲一條邊。ide 咱們想要到達一個目
相關文章
相關標籤/搜索