JavaShuo
欄目
標籤
【RL】強化學習的基本思想
時間 2021-01-02
標籤
IL&IRL&RL
機器學習
深度學習
算法
简体版
原文
原文鏈接
在機器學習中,有監督學習和無監督學習的特點是基於已有的數據,去學習數據的分佈或蘊含的其他重要信息。強化學習與上述這二者最顯著的不同在於,首先它不是基於已有的數據進行學習,而是針對一個環境進行學習;另外,它的目標不是學習數據中蘊含的信息,而是尋找能夠在環境中取得更多獎勵的方法。通俗地說,監督學習的目標只是「弄清楚環境是什麼樣的」,而強化學習的目標是「在這個環境中生活得更好」。上述的特點導致了強化學習
>>阅读原文<<
相關文章
1.
強化學習(RL)基本概念
2.
強化學習(RL)
3.
RL強化學習基礎課 class.3
4.
強化學習介紹(RL)
5.
強化學習【RL】推薦
6.
強化學習之五:基於模型的強化學習(Model-based RL)
7.
【RL】前言和強化學習基本概念
8.
深度強化學習CS285-Lec17 Distributed RL
9.
強化學習(RL)初印象
10.
強化學習簡介 【RL系列】
更多相關文章...
•
Lua 基本語法
-
Lua 教程
•
C# 基本語法
-
C#教程
•
Kotlin學習(二)基本類型
•
Kotlin學習(一)基本語法
相關標籤/搜索
強化學習
強化學習篇
哲學思想
思想
強化
本想
強的
0.強化學習導論
強化學習鍊金術
Hibernate教程
PHP教程
MySQL教程
學習路線
初學者
代碼格式化
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
說說Python中的垃圾回收機制?
2.
螞蟻金服面試分享,阿里的offer真的不難,3位朋友全部offer
3.
Spring Boot (三十一)——自定義歡迎頁及favicon
4.
Spring Boot核心架構
5.
IDEA創建maven web工程
6.
在IDEA中利用maven創建java項目和web項目
7.
myeclipse新導入項目基本配置
8.
zkdash的安裝和配置
9.
什麼情況下會導致Python內存溢出?要如何處理?
10.
CentoOS7下vim輸入中文
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
強化學習(RL)基本概念
2.
強化學習(RL)
3.
RL強化學習基礎課 class.3
4.
強化學習介紹(RL)
5.
強化學習【RL】推薦
6.
強化學習之五:基於模型的強化學習(Model-based RL)
7.
【RL】前言和強化學習基本概念
8.
深度強化學習CS285-Lec17 Distributed RL
9.
強化學習(RL)初印象
10.
強化學習簡介 【RL系列】
>>更多相關文章<<