強化學習(RL)

強化學習是機器學習中的一個領域,強調如何基於環境而行動,以取得最大化的預期利益。其靈感來源於心理學中的行爲主義理論,即有機體如何在環境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產生能獲得最大利益的習慣性行爲。——wiki 強化學習在許多學科都有應用,除了AI外,還包括自動化的控制理論,數學中的運籌學和認知科學。 在機器學習中,通常可以分爲有監督學習(分類,迴歸),無監督學習(聚類,降維)和強
相關文章
相關標籤/搜索