JavaShuo
欄目
標籤
強化學習之階段性任務和連續性任務3
時間 2020-12-30
原文
原文鏈接
階段性任務是設置一個停止點在階段停止的時候,agent回顧這一階段所獲得的回報,看他自己做得如何。然後在下一回合,在同樣的環境下,利用上一個階段的知識,採取更好的行動獲得最大的reward。例如 一盤棋下完就是一個階段,agent 從第一盤棋中獲取經驗,來下第二盤棋獲得更好地經驗。 連續任務是沒有停止點的,智能體必須邊學採取最佳動作,邊和環境交互。例如買賣股票,市場是一值存在的,所以不存在一個截至
>>阅读原文<<
相關文章
1.
flink任務性能優化
2.
多任務——任務相關性
3.
3七、IFE任務12——學習CSS 3的新特性
4.
任務的屬性
5.
週期性任務
6.
Linux基礎---計劃任務之一次性計劃任務(at)和週期性計劃任務(crontab)
7.
任務段
8.
[自習任我行]第二階段任務跟蹤6
9.
[自習任我行]第二階段任務跟蹤1
10.
[自習任我行]第二階段任務跟蹤2
更多相關文章...
•
Eclipse 任務管理
-
Eclipse 教程
•
SQLite 事務(Transaction)
-
SQLite教程
•
互聯網組織的未來:剖析GitHub員工的任性之源
•
適用於PHP初學者的學習線路和建議
相關標籤/搜索
任務
任性
任務3
Hive任務優化
連任
多任務
任務一
戰鬥任務
任務指標
新任務
PHP 7 新特性
XLink 和 XPointer 教程
Spring教程
學習路線
服務器
微服務
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
微軟準備淘汰 SHA-1
2.
Windows Server 2019 Update 2010,20H2
3.
Jmeter+Selenium結合使用(完整篇)
4.
windows服務基礎
5.
mysql 查看線程及kill線程
6.
DevExpresss LookUpEdit詳解
7.
GitLab簡單配置SSHKey與計算機建立連接
8.
桶排序(BucketSort)
9.
桶排序(BucketSort)
10.
C++ 桶排序(BucketSort)
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
flink任務性能優化
2.
多任務——任務相關性
3.
3七、IFE任務12——學習CSS 3的新特性
4.
任務的屬性
5.
週期性任務
6.
Linux基礎---計劃任務之一次性計劃任務(at)和週期性計劃任務(crontab)
7.
任務段
8.
[自習任我行]第二階段任務跟蹤6
9.
[自習任我行]第二階段任務跟蹤1
10.
[自習任我行]第二階段任務跟蹤2
>>更多相關文章<<