JavaShuo
欄目
標籤
強化學習之階段性任務和連續性任務3
時間 2020-12-30
原文
原文鏈接
階段性任務是設置一個停止點在階段停止的時候,agent回顧這一階段所獲得的回報,看他自己做得如何。然後在下一回合,在同樣的環境下,利用上一個階段的知識,採取更好的行動獲得最大的reward。例如 一盤棋下完就是一個階段,agent 從第一盤棋中獲取經驗,來下第二盤棋獲得更好地經驗。 連續任務是沒有停止點的,智能體必須邊學採取最佳動作,邊和環境交互。例如買賣股票,市場是一值存在的,所以不存在一個截至
>>阅读原文<<
相關文章
1.
flink任務性能優化
2.
多任務——任務相關性
3.
3七、IFE任務12——學習CSS 3的新特性
4.
任務的屬性
5.
週期性任務
6.
Linux基礎---計劃任務之一次性計劃任務(at)和週期性計劃任務(crontab)
7.
任務段
8.
[自習任我行]第二階段任務跟蹤6
9.
[自習任我行]第二階段任務跟蹤1
10.
[自習任我行]第二階段任務跟蹤2
更多相關文章...
•
Eclipse 任務管理
-
Eclipse 教程
•
SQLite 事務(Transaction)
-
SQLite教程
•
互聯網組織的未來:剖析GitHub員工的任性之源
•
適用於PHP初學者的學習線路和建議
相關標籤/搜索
任務
任性
任務3
Hive任務優化
連任
多任務
任務一
戰鬥任務
任務指標
新任務
PHP 7 新特性
XLink 和 XPointer 教程
Spring教程
學習路線
服務器
微服務
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
resiprocate 之repro使用
2.
Ubuntu配置Github並且新建倉庫push代碼,從已有倉庫clone代碼,並且push
3.
設計模式9——模板方法模式
4.
avue crud form組件的快速配置使用方法詳細講解
5.
python基礎B
6.
從零開始···將工程上傳到github
7.
Eclipse插件篇
8.
Oracle網絡服務 獨立監聽的配置
9.
php7 fmp模式
10.
第5章 Linux文件及目錄管理命令基礎
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
flink任務性能優化
2.
多任務——任務相關性
3.
3七、IFE任務12——學習CSS 3的新特性
4.
任務的屬性
5.
週期性任務
6.
Linux基礎---計劃任務之一次性計劃任務(at)和週期性計劃任務(crontab)
7.
任務段
8.
[自習任我行]第二階段任務跟蹤6
9.
[自習任我行]第二階段任務跟蹤1
10.
[自習任我行]第二階段任務跟蹤2
>>更多相關文章<<