JavaShuo
欄目
標籤
Q-learing
時間 2020-07-20
標籤
learing
简体版
原文
原文鏈接
本文轉自:https://www.jianshu.com/p/29db50000e3f 一、Q-learning例子 假設有這樣的房間 若是將房間表示成點,而後用房間之間的連通關係表示成線,以下圖所示: web 這就是房間對應的圖。咱們首先將agent(機器人)處於任何一個位置,讓他本身走動,直到走到5房間,表示成功。爲了可以走出去,咱們將每一個節點之間設置必定的權重,可以直接到達5的邊設置爲10
>>阅读原文<<
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
Appium入門
2.
Spring WebFlux 源碼分析(2)-Netty 服務器啓動服務流程 --TBD
3.
wxpython入門第六步(高級組件)
4.
CentOS7.5安裝SVN和可視化管理工具iF.SVNAdmin
5.
jedis 3.0.1中JedisPoolConfig對象缺少setMaxIdle、setMaxWaitMillis等方法,問題記錄
6.
一步一圖一代碼,一定要讓你真正徹底明白紅黑樹
7.
2018-04-12—(重點)源碼角度分析Handler運行原理
8.
Spring AOP源碼詳細解析
9.
Spring Cloud(1)
10.
python簡單爬去油價信息發送到公衆號
本站公眾號
歡迎關注本站公眾號,獲取更多信息