JavaShuo
欄目
標籤
強化學習方法分類
時間 2021-01-06
原文
原文鏈接
一、理解環境or感知環境 Model-based:先理解真實世界是怎樣的,並建立一個模型來模擬現實世界的反饋,通過想象來預判新下來將要發生的所有情況,然後選擇這些想象情況中最好的那種,並依據這種情況來採取下一步的策略。 Model-free:不依賴環境,不嘗試去理解環境,Agent會根據現實環境的反饋採取下一步的動作,一步一步等待真實世界的反饋,再根據反饋採取下一步行動。 ■例如Q-learnin
>>阅读原文<<
相關文章
1.
【強化學習】強化學習分類
2.
強化學習——強化學習的算法分類
3.
強化學習算法分類總結
4.
強化學習的分類
5.
強化學習分類
6.
強化學習--綜述3之強化學習的分類
7.
強化學習(Reinforcement Learning)的方法分類
8.
分佈式強化學習的分類
9.
強化學習 基礎分類
10.
強化學習中的各類算法
更多相關文章...
•
您已經學習了 XML Schema,下一步學習什麼呢?
-
XML Schema 教程
•
我們已經學習了 SQL,下一步學習什麼呢?
-
SQL 教程
•
Kotlin學習(二)基本類型
•
Kotlin學習(一)基本語法
相關標籤/搜索
強化學習
學習方法
強化學習篇
分類法
學科分類
強化
方法學
數學方法
自學方法
類化
PHP教程
Hibernate教程
Thymeleaf 教程
學習路線
算法
初學者
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
JDK JRE JVM,JDK卸載與安裝
2.
Unity NavMeshComponents 學習小結
3.
Unity技術分享連載(64)|Shader Variant Collection|Material.SetPassFast
4.
爲什麼那麼多人用「ji32k7au4a83」作密碼?
5.
關於Vigenere爆0總結
6.
圖論算法之最小生成樹(Krim、Kruskal)
7.
最小生成樹 簡單入門
8.
POJ 3165 Traveling Trio 筆記
9.
你的快遞最遠去到哪裏呢
10.
雲徙探險中臺賽道:借道雲原生,尋找「最優路線」
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
【強化學習】強化學習分類
2.
強化學習——強化學習的算法分類
3.
強化學習算法分類總結
4.
強化學習的分類
5.
強化學習分類
6.
強化學習--綜述3之強化學習的分類
7.
強化學習(Reinforcement Learning)的方法分類
8.
分佈式強化學習的分類
9.
強化學習 基礎分類
10.
強化學習中的各類算法
>>更多相關文章<<