【RL】強化學習的基本思想

時間 2021-01-02

標籤 IL&IRL&RL 機器學習深度學習算法简体版

原文原文鏈接

在機器學習中，有監督學習和無監督學習的特點是基於已有的數據，去學習數據的分佈或蘊含的其他重要信息。強化學習與上述這二者最顯著的不同在於，首先它不是基於已有的數據進行學習，而是針對一個環境進行學習；另外，它的目標不是學習數據中蘊含的信息，而是尋找能夠在環境中取得更多獎勵的方法。通俗地說，監督學習的目標只是「弄清楚環境是什麼樣的」，而強化學習的目標是「在這個環境中生活得更好」。上述的特點導致了強化學習

>>阅读原文<<

1. 強化學習（RL）基本概念
2. 強化學習(RL)
3. RL強化學習基礎課 class.3
4. 強化學習介紹（RL）
5. 強化學習【RL】推薦
6. 強化學習之五：基於模型的強化學習（Model-based RL）
7. 【RL】前言和強化學習基本概念
8. 深度強化學習CS285-Lec17 Distributed RL
9. 強化學習（RL）初印象
10. 強化學習簡介【RL系列】
更多相關文章...
• Lua 基本語法 - Lua 教程
• C# 基本語法 - C#教程
• Kotlin學習（二）基本類型
• Kotlin學習（一）基本語法

相關標籤/搜索