深度強化學習系列之(1): 強化學習概述

深度強化學習 概述 機器學習是人工智能的一個分支,在近30多年已發展爲一門多領域交叉學科,涉及機率論、統計學、逼近論、凸分析、計算複雜性理論等的學科。強化學習(RL)做爲機器學習的一個子領域,其靈感來源於心理學中的行爲主義理論,即智能體如何在環境給予的獎勵或懲罰的刺激下,逐步造成對刺激的預期,產生能得到最大利益的習慣性行爲。它強調如何基於環境而行動,以取得最大化的預期利益。通俗的講:就是根據環境學
相關文章
相關標籤/搜索