深度強化學習系列之(1): 強化學習概述

時間 2019-12-15

標籤深度強化學習系列概述简体版

原文原文鏈接

深度強化學習概述機器學習是人工智能的一個分支，在近30多年已發展爲一門多領域交叉學科，涉及機率論、統計學、逼近論、凸分析、計算複雜性理論等的學科。強化學習(RL)做爲機器學習的一個子領域，其靈感來源於心理學中的行爲主義理論，即智能體如何在環境給予的獎勵或懲罰的刺激下，逐步造成對刺激的預期，產生能得到最大利益的習慣性行爲。它強調如何基於環境而行動，以取得最大化的預期利益。通俗的講:就是根據環境學

>>阅读原文<<