七月算法強化學習 第一課 學習筆記

一、強化學習簡介與應用: 1.強化學習定義: 強化學習是機器學習中的一個領域,強調如何基於環境而行動,以取得最大化的預期利益。其靈感來源於心理學中的行爲主義理論,即有機體如何在環境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產生能獲得最大利益的習慣性行爲。 2.強化學習起源: Artificial Intelligence Control Theory Operation Research C
相關文章
相關標籤/搜索